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Ce texte est dans le même esprit que celui que j'avais écrit sur la relativité générale 
[HumlO] . Il a pour but de présenter la mécanique en utilisant un langage de 
mathématicien tout en ne perdant pas de vue l'aspect physique du problème. La 
mécanique quantique étant par essence une théorie mathématique, on peut ajuste 
titre se dire que cette démarche n'est pas originale. L'originalité réside plutôt dans 
le point de vue que je choisis d'adopter : j'essaye de présenter les intuitions qui 
ont conduit au formalisme de la théorie en allant le plus rapidement possible au 
but. On ne trouvera donc ici ni exemples, ni exercices et seulement très peu d'ap- 
plications, bien que la plupart du texte ne dépasse pas le niveau de licence. Je 
me base principalement sur l'excellent livre de Jean-Louis Basdevant et Jean Dali- 
bard [BD86J. J'utilise également l'incontournable [Me95j. Mon travail a surtout 
consisté à en extraire les points qui me semblaient les plus importants pour com- 
prendre la construction de la mécanique quantique et en répondant à certaines 
questions que, de par ma formation purement mathématique, je me suis posées. 
Il va sans dire que les choix que j'ai faits sont discutables et certains les trouve- 
ront sans doute inadaptés à leur manière de penser. Je donne aussi très peu de 
références. Pour finir, je conseille à tout lecteur qui voudrait aborder la mécanique 
quantique par un ouvrage de vulgarisation, de lire le livre d'A. Mouchet | Mo95| . 
qui, sans rentrer dans les détails techniques, présente de manière passionnante les 
bases de la théorie. 
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CHAPITRE I 



La naissance de la mécanique quant ique 



La mécanique quantique est née un peu de la même manière que la relativité 
générale : des observations expérimentales nous ont obligés à revoir complètement 
notre manière de penser. Alors que la relativité générale a bouleversé la vision 
que nous avions de l'univers à grande échelle, la mécanique quantique remet en 
cause toute notre intuition concernant la physique des particules. En particulier, 
jusqu'en 1900, matière et ondes étaient complètement dissociées. La matière était 
composée de particules, c'est-à-dire de briques élémentaires, vues alors comme de 
petites "billes" . Les ondes étaient déjà plus difficiles à concevoir, plus abstraites car 
justement immatérielles, bien qu'étant omniprésentes au quotidien : lumière, son, 
vagues à la surface de la mer,... On pourrait les définir comme des propagations 
de perturbations du milieu ambiant. La barrière entre ces deux notions va tomber 
avec la mécanique quantique mais il faudra du temps pour accepter de tels chan- 
gements de conception du monde qui nous entoure. C'est en 1900 que tout a com- 
mencé lorsque Planck montre que des oscillateurs mécaniques chargés ne peuvent 
émettre ou absorber que des quantités discrètes d'énergie lumineuse. Le travail 
de Planck n'est en fait qu'empirique : pour être précis, il montre qu'en faisant 
cette hypothèse étonnante, on peut écrire une formule simple qui modélise parfai- 
tement le spectre des corps noirs. Les physiciens de l'époque ne voyaient là qu'une 
astuce mathématique permettant de trouver des résultats correspondant à l'ob- 
servation. En 1905, Einstein fut le premier à interpréter physiquement ces idées : 
la lumière était elle-même composée de particules, ou tout au moins de ce qu'il 
appelait quanta d'action et qui furent rebaptisés photons en 1926 par Lewis, ce qui 
était en complète contradiction avec le caractère ondulatoire de la lumière. Cette 
interprétation physique des résultats de Planck fut l'objet de nombreuses contre- 
verses pendant plusieurs années : qu'une onde comme la lumière puisse avoir un 
comportement corpusculaire était à l'époque inacceptable. En 1912, Bohr propose 
un modèle de l'atome d'hydrogène convaincant en postulant là-aussi que l'absorp- 
tion et l'émission de lumière par la matière se faisait par quantités discrètes. 

Ce n'est en fait qu'à partir de 1914 que ces idées théoriques vont trouver leur 
confirmation expérimentale avec les expériences de Franck et Hertz qui corro- 
borent parfaitement les prédictions de Bohr sur la quantification de l'absorption et 
émission d'énergie lumineuse par les systèmes atomiques ou moléculaires. Plusieurs 
expériences viennent confirmer cette théorie naissante (la mécanique quantique) 
mais nous allons nous borner à étudier celle des deux fentes de Young (qui est en 
fait réalisée par F. Shimizu, K. Shimizu et H. Takuma telle que décrite ci-dessous) 
qui prouve de manière éclatante la dualité onde/matière. 
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I. LA NAISSANCE DE LA MÉCANIQUE QUANTIQUE 



L'expérience est la suivante : on lance des atomes de néon (l'expérience peut 
aussi être faite avec des électrons, neutrons, molécules) perpendiculairement à une 
plaque opaque percée de deux fentes. Un peu plus loin, on place un écran parallèle 
à la plaque et on observe l'endroit où les atomes de néons vont frapper l'écran 
après être passés dans l'une des deux fentes. 



Voici alors ce qu'on observe : 

- Chaque atome laisse une marque sur l'écran en un point précis. Cela confirme 
ce que l'on savait déjà à savoir l'aspect corpusculaire de la matière. 

- Beaucoup plus étonnant : quand on envoie une succession d'atomes du même 
endroit, avec la même vitesse et dans la même direction, ils ne frappent pas tous 
l'écran au même point. Quand on le fait un grand nombre de fois, on s'aperçoit 
qu'ils frappent l'écran à peu près partout mais beaucoup plus souvent sur des 
franges (coloriées sur le dessin ci-dessus). Plus précisément, on peut vérifier que 
les atomes viennent frapper l'écran de manière aléatoire avec une probabilité 
dont la densité est parfaitement définie et sinusoïdale. Les franges correspondent 
aux "pics" de cette densité. 

- Plus étonnant encore, si l'on bouche l'une des fentes, d'autres franges appa- 
raissent. Ce qui est frappant, c'est qu'il y a des régions de l'écran qui sont 
atteintes régulièrement lorsque une seule des deux fentes est ouverte et qui ne 
le sont pas si on ouvre la deuxième fente. Ce type de comportement est ca- 
ractéristique de ce qu'on observe pour des ondes : sans rentrer dans les détails, 
la somme de deux ondes est encore une onde mais les "pics" d'oscillations ne sont 
plus les mêmes. Cette expérience met en évidence le comportement ondulatoire 
de la matière. 

- Le point précédent suggère alors une autre expérience : on ouvre les deux fentes 
et on observe les atomes qui passent par la fente 1 et on note leur point d'impact. 
Tout se passe alors comme si la fente 2 était bouchée. Cela semble contredire 
l'expérience précédente. En fait, pour faire cette deuxième expérience, on doit 
s'y prendre différemment et cela modifie le résultat. Plus précisément, faire une 
mesure influe sur le résultat des expériences. 

Nous avons décrit ci-dessus de manière très imprécise à la fois le déroulement 
de l'expérience et son résultat. L'idée était seulement de montrer que, comme en 
relativité générale, il faut remettre sérieusement en question sa manière de voir les 
choses pour bâtir une théorie cohérente. 



Atome 
de néon 




Figure 1. Expérience des deux fentes de Young 



CHAPITRE II 



Mécanique ondulatoire 

Plusieurs tentatives ont été nécessaires avant d'aboutir à la formulation actuelle 
de la mécanique quantique. Plus précisément, au milieu des années 1920, il y avait 
deux approches concurrentes pour modéliser les phénomènes quantiques : celle de 
Heisenberg, Born, Jordan et Dirac, appelée mécanique des matrices, et celle de 
Schrodinger, appelée mécanique ondulatoire mise au point dans une série de huit 
articles datant de 1926 et dont nous présentons la démarche dans ce chapitre. Cela 
permettra de comprendre de manière relativement intuitive comment ces deux 
théories seront unifiées pour donner la mécanique quantique telle que formalisée 
actuellement et dont les principes seront présentés à partir du Chapitre IIHI 

1. Modélisation d'une onde 

En raison de la nature ondulatoire de la matière décrite plus haut, nous avons 
besoin de nous intéresser de plus près à ce qu'est une onde et à la manière dont 
on peut la modéliser mathématiquement. Nous avons expliqué qu'une onde se 
définissait comme la propagation d'une certaine pertubation "ondulatoire" à tra- 
vers un milieu. Nous avons également vu que ces ondes pouvaient être de na- 
ture bien différentes selon qu'il s'agisse d'un son, d'une vague ou encore d'une 
onde gravitationnelle comme rencontrée en relativité générale. D'un point de vue 
mathématique, ces phénomènes ont tous en commun de faire intervenir les solu- 
tions de l'équation des ondes 

D<p = (II.l) 

(où □ := — dtt+A = —d u + J2i du es t l'opérateur D'Alembertien) ou tout au moins 
des solutions d'équations dont la forme est très proches et qui peuvent avoir des 
termes supplémentaires en fonction du milieu observé. C'est de cette constatation 
que nous allons partir : une onde sera modélisée par une fonction ip : M — > C, 
solution d'une certaine équation et où M est l'espace-temps que l'on considère. 
Le plus souvent on travaille avec celui de la mécanique classique puisque de nom- 
breux points de la physique quantique s'accordent mal avec les théories relativistes. 
La fonction ip doit contenir toute l'information nécessaire à la description de l'onde. 

Une solution évidente de l'équation (III. ip est la fonction 

<p(x,t) = <p e^- x -^ (U.2) 

où x représente le vecteur position, t le temps, k le vecteur d'onde (c'est-à-dire le 
vecteur de propagation d'onde), u est la fréquence de l'onde et x ■ k est le produit 
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scalaire. On suppose ici que l'on travaille sur M. n x M avec le produit scalaire 
canonique sur R n , espace des vecteurs positions. <po est une constante que nous 
laissons de côté pour l'instant. La raison pour laquelle le vecteur k est appelé 
vecteur d'onde est la suivante : on a 

<p(x, t) — <f(x+ wk/\\k\\,t + 1), 

ce qui signifie que le phénomène observé, quel qu'il soit, a les mêmes propriétés en 
(x, t) et en (x+wk/\ \k\ |, t + 1) et a donc un vecteur de propagation égal à wk/\ \k\ \. 
Par ailleurs, on observe que, pour que <p soit solution de (lll.lj) . il faut et il suffit 



que w = \\k\\ . Autrement dit, le vecteur de propagation est bien le vecteur k. 

DÉFINITION II. 3. Une onde de la forme (III. 2p est appelée onde monochroma- 
tique. 

On remarquera que cette définition est purement mathématique et n'est pour 
l'instant reliée à aucun phénomène physique. 



2. Modélisation d'une particule en mécanique ondulatoire et équation 

de Schrôdinger 

Compte-tenu de l'expérience des fentes de Young décrite plus haut, l'idée (auda- 
cieuse) va être de modéliser les particules de la même manière que des ondes, à 
savoir par une fonction ip : M — > C contenant toute l'information sur la particule. 
Ici, M est l'espace-temps de la mécanique classique et s'écrit M = M' x K. où M', 
est le "domaine d'existence" de la particule. Dans ce qui suit, on prendra M' = M 3 . 
Pour tenir compte de l'aspect "matériel" de la particule, on va imposer : 

Principe 1 : la probabilité de trouver la particule à l'instant t dans une portion 
Ocl 3 est égale à 



[ \tp(x,t)\ 2 dx. (LIA) 
Jn 

Toute fonction suffisament dérivable ip '■ M — > C n'est pas nécessairement admis- 
sible. Par exemple, le principe 1 impose que l'on ait 

/ \ip{x,t)\ 2 dx = 1. (II.5) 

L'expérience des fentes de Young suggère également que les ondes puissent se 
superposer ce que conduit à supposer 

Principe de superposition : Toute combinaison linéaire de fonctions d'onde 
est également une fonction d'onde admissible 

Avant même de l'expliquer, énonçons le principe fondamental de la mécanique 
ondulatoire : 

Principe 2a : La fonction d'onde ip : M — > C d'une particule de masse m 
évoluant dans le vide et soumise à aucune interaction est solution de l'équation de 



3. D'OÙ VIENT L'ÉQUATION DE SCHRÔDINGER ? 



Schrodinger 

H 2 

ihd t ij = Aip (11.6) 

2m 

où h est une constante universelle appelée constante de Planck et où le laplacien 
A est un laplacien spatial, avec la convention de signe suivante : 

A = <9n + d 22 + d 33 . 



On prendra garde au fait que le laplacien ici est celui habituellement 
utilisé en mécanique quantique. Il est égal l'opposé de celui utilisé en 
géométrie différentiel (et en particulier dans |Hum lOj). 

La constante de Planck h possède les dimensions dune énergie multipliée par le 
temps, ou de manière équivalente d'une quantité de mouvement par une longueur. 
Voici sa valeur exprimée en Joule. Secondes : 

h= 1,0545716281(T 34 J.s 

avec une incertitude standard de ±0.00000005310~ 34 J.s. 

Dans le cas d'une particule placée dans un potentiel, on a 

Principe 2b : La fonction d'onde ip : M — >■ C d'une particule placée dans un 
potentiel V(x, t) est solution de : 

h 2 

iHdtip = -—M + Vif). (II. 7) 



3. D'où vient l'équation de Schrodinger ? 

Dans [ HumlOj , nous avons expliqué comment des considérations physiques habiles 
permettaient d'arriver à l'équation d'Einstein. Les justifications pour postuler les 
principes 2a et 2b ci-dessus sont beaucoup plus audacieuses. D'ailleurs, Schrodinger 
lui-même n'était pas satisfait de son équation. La raison principale de l'ériger 
en tant que principe est qu'elle donne des résultats remarquablement conformes 
par rapport aux mesures expérimentales. Par contre, les arguments théoriques qui 
aboutissent à l'équation ont été mis au point après coup et sont relativement flous. 
Nous n'allons pas les répéter en détail ici. L'une des idées est de minimiser une 
fonctionnelle d'énergie concernant la fonction d'onde et d'enlever les termes non- 
linéaires de l'équation qui en découle. Cette idée mime le cas classique qui consiste 
pour décrire le mouvement des particules à minimiser une fonctionnelle d'énergie 
sur les trajectoires possibles. Les raisons pour lesquelles on ignore purement et 
simplement les termes non-linéaires sont plus qu'approximatives. 

Une deuxième raison est la suivante : commençons par imaginer ce que pourrait 
être une particule qui se déplace à vitesse constante v dans une direction donnée 
k. L'idée naturelle serait de prendre pour de telles particules la fonction d'onde 
monochromatique donnée par (III. 2}) : 
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Il faut d'abord remarquer que cette fonction particulière n'est pas admissible puis- 
qu'elle ne vérifie pas (III. 5j) . Rappelons que la quantité de mouvement et l'énergie 
totales d'un système jouent un rôle particulier en physique du fait qu'elles sont 
conservées avec le temps, du moins dans le cas de systèmes isolés sans poten- 
tiel. Beaucoup de théories physiques sont construites en s'appuyant sur ces gran- 
deurs, en particulier en relativité générale (voir [HumlOj). C'est pourquoi la fonc- 
tion d'onde ci-dessus sera plutôt écrite en termes de quantité de mouvement p et 
d'énergie E avec 

E = hooetp 2 = 2mE. (11.8) 

Dans le paragraphe El nous expliquerons pourquoi le p que nous avons ainsi 
défini s'interprète bien comme une quantité de mouvement. Ces conditions sont 
données pour que les ondes définies ci-dessous par (III. 91) et qui sont celles que nous 



considérerons désormais soient solutions de l'équation (III. 6j) : 

xl){x,t) =^ e^ p - x - Et) . (II.9) 

Bien que ne satisfaisant pas (111.5p . ces fonctions d'onde seront considérées comme 
"de base" pour modéliser au moins localement des particules libres de quantité 
de mouvement p et d'énergie E et sont appelées ondes de de Broglie. Avec cette 
vision, nous pouvons revoir l'expérience des fentes de Young. On résout l'équation 
( IH.6j) avec les conditions aux limites suivantes : 



- i/j = en tout point de la plaque opaque, hormis sur les deux trous. 

- Notons z la coordonnée de l'axe perpendiculaire à l'écran et à la plaque opaque. 
On veut que si z — > — oo et t — > — oo, l'onde tende vers une onde de de Broglie 
dans la direction de z (on néglige l'onde réfléchie sur la plaque opaque). 

- Pour z +oo, ip — y 0. 

On peut alors montrer que le problème admet bien une et une seule solution qui 
conduit à des résultats conformes à l'expérience. 



4. Compatibilité de l'équation de Schrôdinger avec la définition de la 

fonction d'onde. 

Une première remarque est la suivante : on peut se demander si la normalisation 
( III. 5p . qui doit être vérifiée pour tout t, est compatible avec l'équation (III. 6p . En 
fait, non seulement on a compatibilité entre ces relations mais on a même plus : 
l'équation (III. 6[) implique que si la relation ( III.5P est vraie pour un t G M, alors 
elle l'est pour tout t. En effet, avec (III. 6 j) et en utilisant le fait que ip satisfait : 

- h 2 - 
ihd t ip = —Aip 
2m 

on voit que 

d t I \i)\ 2 dx = [ (d^ipdx + [ (dt^dx 

JR3 Jr3 Jr3 

= — f / ^Aipdx - I (A^ipdx) 

2^ \Jr3 J R 3 ) 

= 0. 



5. PAQUET D'ONDES 
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Ici, on a supposé tout de même qu'une fonction admissible permettait de faire 
l'intégration par partie de la dernière ligne, c'est-à-dire par exemple que ip £ 
C 2 (M) r\H 2 > 2 (IR 2 ), H 2 * 2 désignant l'espace de Sobolev des fonctions L 2 dont toutes 
les dérivées d'ordre inférieur ou égal à 2 sont aussi dans L 2 . Nous ne nous arrêterons 
pas sur ces considérations. Remarquons seulement que de telles hypothèses sont 
physiquement plausibles : l'action d'une particule à l'infini est très faible, voir 
inexistante. On peut donc supposer que sa fonction d'onde ainsi que ses dérivées 
décroissent suffisamment pour permettre ce genre de calcul. 



5. Paquet d'ondes 

Malgré ce qui a été dit dans le paragraphe El on a envie de penser que les ondes de 
de Broglie, même si elles ne peuvent modéliser de manière globale une particule, 
doivent pouvoir le faire de manière locale au moins. Puisque par ailleurs, une 
combinaison linéaire de fonctions d'onde admissibles est aussi une fonction d'onde 
admissible, on a envie de considérer une combinaison linaire de fonctions d'ondes 
de de Broglie. Malheureusement, cela ne suffit pas pour que la relation f lll.5j) soit 



satisfaite. Pour cela, il faut considérer une "somme infinie non dénombrable d'ondes 
de de Broglie", autrement dit "l'intégrale d'une famille d'ondes de de Broglie" que 
nous pouvons indexer par le vecteur k de propagation de chacune de ces ondes de 
de Broglie. Plus précisément, on dira que 

DÉFINITION 11.10. Un paquet d'onde est une fonction d'onde de la forme 

^(x,t) = [ ip(k)e^ k - x - E{k)t) dk 

où Von doit se rappeler que E(k) = ^— (voir (III. 8j) ). 



En fait, ces considérations sont loin d'être gratuites : le résultat ci-dessous montre 
que toute fonction d'onde admissible est un paquet d'ondes. Plus précisément, 
nous montrons le résultat suivant : 

THÉORÈME II. 11. Soit ip : M — > C une fonction d'onde admissible solution 
de l'équation de Schrôdinger (III. 6j) . Alors, il existe une fonction (p : R 3 — > C (en 
particulier, qui ne dépend pas de t) telle que 

= 7Aïm f V(p)e^ x - Ee >dp 
où l'on rappelle que E = \p\ 2 /(2m). De plus, on a la normalisation 

\f(p)\ 2 d P = I mx,t)\ 2 dx=l. 



Démonstration : Soit f(x, t) une fonction admissible solution de flll.6j) . On définit 
pour tous (p, t), 

9(p,t)= , n L /9 / f{x,t)e-y- x dx. 



(2ttH) 3 / 2 

On calcule alors, en utilisant l'équation (III. 6jl puis une intégration par parties : 
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1 1 ^(A x f(x,t))e-& x dx 



(2tt^) 3 / 2 J r3 2m 
1 f ih 



(2tt^) 3 / 2 J r3 2m 



f{x,t)A x e-& x dx 



(2tt^) 3 / 2 7 r3 2rn v ' /v fr 2 
Ainsi, en posant 

i|p| 2 i 

= gfatfe^n** = g(p,t)e^ E \ 
on trouve que dt<p(p, t) — et donc que y?(p, t) = y?(p) ne dépend pas de t. D'après 
la relation (11.821) de l'appendice 13 et puisque que g est la transformée de Fourier 
inverse de /, on a 



i 



<p(p)e-* m e* p - x dp. 



(2nhfl 2 

qui est exactement ce que nous cherchions à obtenir. □ 



6. Vitesse d'une particule dans le vide 

6.1. Définition. Revenons maintenant à la modélisation d'une particule. Les 
définitions données plus haut doivent permettre de caractériser complètement une 
particule, en particulier de retrouver sa vitesse. Nous avons défini la vitesse de 
propagation d'une onde monochromatique dans le paragraphe (JTJ) mais comme 
nous l'avons vu, ces fonctions d'onde (celles que nous avons appelées aussi ondes 
de de Broglie) ne peuvent en aucun cas modéliser une particule puisqu'elles ne 
satisfont pas la relation (III. 5j) . Par ailleurs, la notion de vitesse qui apparaît pour 
de telles ondes n'est pas généralisable à une fonction d'onde admissible quelconque. 
D'ailleurs, il n'y a aucune raison de dire qu'il existe un vecteur k tel que ip( x + 
k, t + 1) = ipi^x, t) comme c'est le cas pour les ondes de de Broglie. Les définitions 
que nous allons utilisons sont donc les suivantes et semblent effectivement bien 
plus naturelles : d'abord, pour parler de vitesse, il faut parler de position de la 
particule. Mais par définition, une particule n'a justement pas de position précise 
puisqu'elle ne possède que des probabilités de présence. Ce qui est naturel, c'est 
de définir l'espérance de sa position, autrement dit l'espérance de la densité de 
probabilité ip : nous parlerons de centre de la particule que nous définirons comme 

< x >:= / x\ïp\ 2 dx. (11.12) 

Ce centre représente donc la "position la plus probable de la particule". Bien 
évidemment, on peut avoir un grand écart type ce qui va donner les "incertitudes 
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de mesure". Il est alors naturel de définir la vitesse de la particule comme la vitesse 
de < x > qui cette fois a bien un sens précis. 

DÉFINITION 11.13. On considère une particule de fonction d'onde ip. Sa vitesse 
sera alors définie par 

< v >:= d t < x >= / xd t \i/j\ 2 dx. 

Même si la définition semble naturelle, on peut se poser la question de savoir si 
la vitesse ainsi définie a un sens raisonnable. En particulier, il semblerait justifié 
de demander qu'une particule évoluant dans le vide sans aucune contrainte soit 
animée d'un mouvement rectiligne uniforme. Le résultat suivant montre que c'est 
bien le cas : 

PROPOSITION II. 14. Le vecteur vitesse d'une particule évoluant dans le vide et 
soumise à aucun potentiel est constant. 

La démonstration sera faite dans le paragraphe suivant. 



Nous avons vu dans le paragraphe précédent que si ip est la fonction d'onde d'une 
particule dans le vide, alors on peut l'écrire sous la forme d'un paquet d'ondes : 

4>{x, t) = j^f 2 V(v)e^ x - Et) dp (11.15) 
où E = \p\ 2 /(2m) et où 

\f(p)\ 2 dp= I mx,t)\ 2 dx = l. 



La notation p pour la variable de ip évoque une quantité de mouvement. En fait, 
pour de telle particules, nous définirons même : 

DÉFINITION 11.16. La quantité de mouvement moyenne du paquet d'onde est 
définie par 

<P>= p\<p{p)?dp. 



Cette définition est justifiée par la proposition suivante. 

PROPOSITION II. 17. On a < p >= mv où v est le vecteur vitesse (constant en 



vertu de la proposition 11.14 )- 

Conséquence importante : La fonction \ip\ 2 s'interprète donc comme une den- 
sité de probabilité pour la mesure de la quantité de mouvement. Il existe d'ailleurs 
d'autres moyens, plus physiques, de le voir. En présence d'un potentiel V, on peut 
montrer que le résultat reste le même : si ip est la fonction d'onde d'une particule, 
la densité de probabilité de la quantité de mouvement sera donnée par \(p\ 2 où (p 
est la transformée de Fourier de ip. Notons qu'avec un potentiel, la fonction ip peut 
dépendre de t. 
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6.2. Démonstration de la proposition 1117141 Puisque la particule évolue 
dans le vide et sans contrainte, sa fonction d'onde ip est solution de l'équation 
(111.6p . En prenant le conjugué de cette équation, on voit que ip vérifie 

- h 2 - 

ihd t ip = — A^. 
2m 

On en déduit que 

< v > = [ xd t \ip\ 2 dx 

x(dttl>)vpdx + / {d t ^)ipdx 

ih f — — 

- — / x {ipAipdx — (Aip)ipj dx 

ih f — — 

/ A(xip)ifj — A(xip)ipdx. 

2m .L 3 



On observe maintenant que, en écrivant x = X\e\ + X2&2 + £3^3 et en remarquant 
que Ax = 0, 



3 



A(xip) = diip + xAip. 



i=l 



La même formule est valable avec ip si bien que : 



/ (ipdiip — vpdiïjj) dx ) — - — / x (i/jAïjjdx — {Aijj)ijj\ dx. 
~l Jrs ' I 2m J R 3 



< v >= — 
m 



Or la dernière intégrale du membre de droite n'est autre que < v > tel que calculé 
ci-dessus. Ainsi, 

2 <v> =— VW Ud$ -^diifj) dx. (11.18) 
On écrit maintenant que 

ipdiip = dilipl 2 -i>dii> 
L'intégrale du premier terme du membre de droite est nulle. On obtient donc que 

o ' Pi ^ r 

2<v>= — — V / ^d^dx. (11.19) 

On dérive maintenant cette expression en fonction de t et on utilise de nouveau 
(HH : 

ih f — — 

m J R 3 

2 



= 0. 

Celta termine la preuve de la proposition III. 141 
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6.3. Démonstration de la proposition III. Ï7l On rappelle que le théorème 
de Plancherel-Parseval (voir Appendice |A} dit que si /, h sont des fonctions L 2 et 
si /, h sont leurs transformées de Fourier respectives alors 

f(x)g(x)dx = / f(p)g(p)dp. 

JR 3 

On applique ce résultat avec / = tp et h — —ihdiip (i := 1, 2, 3). On a donc / = Tp 
et, en vertu de ( III. 15[) . h = p^(p où pi est la i-eme coordonnée de p. On obtient 



—ih / ifj(x)diip(x)dx =< pi >:= / Pi\ip(p)\ dp. 
Jr 3 Jr 3 

Le résultat se déduit alors de (III. 181) . 

7. Principe d'incertitude d'Heisenberg 

Le principe d'incertitude d'Heisenberg est l'un des points remarquables et contre- 
intuitifs de la mécanique ondulatoire et de la mécanique quantique en général : 
plus on connaît précisément la position d'une particule, moins on connaît son 
vecteur vitesse et vice-versa. Avant d'énoncer précisément ce principe, il convient 
de remarquer le fait suivant : supposons que g est une fonction telle que \g 
est la densité de probabilité d'une variable aléatoire qui représente une grandeur 
physique, la position ou la vitesse par exemple. Alors, l'espérance de \g\ 2 , c'est-à- 
dire 

< y >■= / y\g(y)\ 2 dy 



2 



représente la moyenne des mesures que nous ferons de cette grandeur physique. 
Par ailleurs, plus l'écart-type sera grand, plus nous aurons des fluctuations dans 
ces mesures même si en moyenne nous trouvons la valeur < y >. Autrement dit, 
la quantité 

Ay 2 :=< y 2 > - < y > 2 
représente l'incertitude dans la mesure de y. 

Prenons maintenant une particule dans le vide représentée par un paquet d'ondes 
(voir Théorème III. IIP 



i/j(x,t) = - / ip{p)e^ x - Et) dp (11.20) 



(27T/Î) 3 / 2 

où E = \p\ 2 /(2m) et où 

\<p(p)\ 2 d P = i m x ,t)\ 2 dx = i. 



Alors, nous avons vu qu'il était naturel de définir la position de la particule par 

< x >:= / x\é(x)\ 2 dx. 



D'après la discussion ci-dessus, la quantité 

Axf :=< x 2 > - < Xi > 2 



16 



IL MÉCANIQUE ONDULATOIRE 



(où Xi est la z-ème coordonnées de x) représentera l'incertitude que nous aurons en 
mesurant la coordonnée Xi de la particule. De même, nous avons vu (voir Proposi- 
tion [TTTTT]) que la fonction |yj| 2 s'interprétait comme une densité de probabilité dans 
la mesure de la quantité de mouvement (et donc dans la vitesse) de la particule. 
Ainsi, en notant la z-ème coordonnée de p, la quantité 



Ap 2 :=< PÏ>~< Pi > 2 



représentera l'incertitude de mesure de la quantité de mouvement de la particule 
sur l'axe des x-,. 



Le principe d'incertitude d'Heisenberg dit alors que 
PROPOSITION 11.21. On a la relation 

AxiApi > h/2. 



Ce résultat dit que si Axi est petit, c'est-à-dire si on peut mesurer avec précision 
la vitesse de la particule, alors Api ne peut pas être trop petit, c'est-à-dire que 
la vitesse de la particule (sur l'axe Xi) ne peut pas être mesurée avec autant de 
précision qu'on le souhaite. 

Remarque 11.22. Nous étudions ici le cas d'une particule dans le vide mais le 
résultat resterait le même avec un contexte physique plus général. 

La Proposition III. 211 est en fait un résultat classique des transformées de Fourier 
dont nous donnons tout de même la preuve en raison de l'importance qu'elle a 
pour la théorie. 



Démonstration : De manière plus générale, si / est une fonction lisse qui décroît 
suffisamment à l'infini et si / est sa transformée de Fourier, nous montrons que 

\f\ 2 ) 2 <^[ (*,-<*, >f\f\{xfdx I ( Pl -<p t >) 2 \f\(p) 2 dp (11.23) 

Cette inégalité implique de manière triviale la Proposition III.2Ï1 en prenant / — ip 
car en développant (x~ < Xi >) 2 et (p»— < pi >) 2 , on voit que 

Ax] = [ ( Xi - < Xi >f\f\{xfalx et Api = [ (p<- < Pl >f\f\{pfdp. 

Soit g une fonction lisse qui tend suffisamment vite vers à l'infini. En intégrant 
par partie par rapport à la variable X{ et en appliquant l'inégalité de Holder, on a 

g 2 ) = ( -2 / Xig(x)dig(x)dx 



<4 / x\g{xydx \ (dig)(xydx 
Jr 3 Jr 3 

<4 f x\g{xfdx [ (d i9 )(p) 2 dp 
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où pour la dernière ligne, nous avons utilisé le théorème de Plancherel-Parseval 
(voir Appendice et où {piQ désigne la transformée de Fourier de la fonction d^g. 
On remarque maintenant que 



ce qui montre que 



dig = —g 



9 2 ) < 4 / x\g{xfdx I p 2 g 2 dp. 



h 2 



Soit maintenant / une fonction lisse qui tend suffisamment vite vers à l'infini. 
En appliquant cette inégalité avec g(x) = e aXi f(x + bxi), a, b étant des réels quel- 
conques, et en faisant ensuite les changements de variables x\ = Xi + b et p\ = Pi + a, 
on montre que pour tous réels a, b G R, on a 

f) (Xi - bff{xfdx ! (p t -a) 2 f 2 dp 

ce qui donne l'inégalité cherchée. □ 

8. Mesures physiques 

Nous avons expliqué comment donner une définition cohérente de position ou de 
quantité de mouvement d'une particule. Cependant, la fonction d'onde est censée 
contenir toutes les propriétés de la particule étudiée. Il faut aussi pouvoir mesurer 
ces grandeurs physique d'une manière ou d'une autre. Comme nous l'avons évoqué 
dans le chapitre [U ces mesures influent sur le résultat des expériences. Il faut 
donc réussir à inclure ces paramètres dans la théorie. Rappelons ce qu'on a trouvé 
jusqu'à présent : 

- la position (moyenne) d'une particule à l'instant t est donnée par 



< x >:= / ip(x,t) (xi>(x,t)) dx; (11.24) 
Jm 3 

en vertu de (III. 191) . la quantité de mouvement (moyenne) d'une particule à l'ins- 
tant t et projetée sur 1' est donnée par 

h. 



<Pi>= / ip(x,t) -dii> dx 
et donc la quantité de mouvement (moyenne) vectorielle p = mv est donnée par 

<p>:= j ip(x,t) dx. (11.25) 

On remarque que les observables "position" et "quantité de mouvement" s'écrivent 
sous la forme 

/ ï^(Âij)dx (11.26) 

où A est un opérateur évalué en la fonction d'onde. Lorsque l'on étudie la position 
de la particule, Aip = xip et lorsque l'on étudie la quantité de mouvement, on prend 
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A = | V. On va voir aussi que l'énergie totale peut elle-aussi s'écrire sous une forme 
similaire. Pour cela, supposons que la particule soit soumise à un potentiel V qui 
ne dépend pas de t (c'est donc un système isolé) si bien que sa fonction d'onde est 
solution de 

h 2 

ihd t ip = Aip + Vif). 

2m 

Notons H l'opérateur — |*-A + V. On a donc 

ihd t ip = Hip, (11.27) 

et donc aussi 

- m$ = Hïp. (11.28) 



Notons E la quantité 



E:= tfj iHip) dx. 



Cette quantité est bien sous la forme (III. 261) et nous allons voir de deux manières 
différentes qu'elle s'interprète comme l'énergie totale du système. D'abord, on a la 
relation suivante : 

d t E = 0. 

En effet, en utilisant le fait que H est auto-adjoint puis les relations (1II.27I) et 

flH28D 

d t E= [ dtîp(àip)dx+ [ (Êîp)dtipdx 



h ! (Èif?j (Èif?j dx + ih ! (Èif?j [Èi^ dx 



= 0. 

Or, c'est un postulat physique très classique que d'interpréter toute intégrale 
première scalaire (autrement dit une quantité conservée avec le temps) d'un système 
isolé comme l'énergie totale du système. Avant de montrer que cette interprétation 
peut se voir d'une autre manière (voir (III. 30p ci-dessous), il convient de préciser 
un peu les choses. 



Ce qui précède conduit à proposer le 



Principe 3 : A chaque grandeur physique a, on associe un opérateur A hermitien 
qui agit sur l'espace des fonctions d'onde et tel que la grandeur physique observée 
soit en moyenne donnée par 

< a >:= / ip [Âifj] dx. 



Remarque 11.29. On utilisera la plupart du temps les notations ci-dessus : si a est 
une grandeur physique, A désignera son opérateur associé et < a > désignera la 
moyenne de a. Par extension, les résultats des mesures expérimentales de a seront 
parfois notés eux aussi < a >. 
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Il faut alors faire quelques observations importantes : soit a une grandeur phy- 
sique d'opérateur associé A. Imaginons une expérience qui mesure la valeur de a 
à l'instant t. Notons a la valeur effectivement mesurée. On va faire une hypothèse 
importante : à l'instant t, on n'a pas d'incertitude sur la valeur de a puisque, jus- 
tement, on vient d'en faire la mesure et puisqu'on en connaît le résultat. Le fait de 
faire cette mesure a donc changé la situation : on sait qu'à l'instant t, < a >= a 
et Aa 2 = 0, bien que pour l'instant, nous n'ayons pas donné de moyen de calculer 
cette valeur. Pour tenir compte de ce principe, on va faire l'hypothèse (peut-être 
assez audacieuse) qu'à l'instant t, on a Aip = aip, ce qui donne bien que : 

< a >= / ipÂipdx = a \ip\ 2 dx = a. 

JR3 J R 3 

Cette hypothèse signifie que nous supposons que l'appareil de mesure a donné la 
valeur exacte de a à l'instant t. Il obéit donc aux lois de la physique classique et n'a 
pas de comportement quantique. Cependant, faire cette hypothèse a de nombreux 
avantages : 

(1) d'abord, elle implique que les valeurs mesurées expérimentalement sont 
nécessairement des valeurs propres de l'opérateur A, qui puisque A est 
auto-adjoint, sont réelles. Notons que ces valeurs propres peuvent être vec- 
torielles par exemple dans le cas de la quantité de mouvement où le vecteur 
p mesuré est une valeur propre qui vérifie Atp = pip- Lorsque le spectre 
de A est discret, comme c'est le cas pour l'opérateur H défini ci-dessus 
associé à l'énergie totale du système, il en découle que la quantité mesurée 
ne peut prendre qu'un ensemble discret, quantifié de valeurs. C'est la rai- 
son pour laquelle on parle de mécanique quantique. Cela nous conforte 
dans l'idée que cette hypothèse est bonne puisque, expérimentalement, ce 
fait avait déjà été observé pour l'énergie (voir le chapitre fl]) . 

(2) Soit maintenant une fonction d'onde que nous décomposons dans l'espace 
des fonctions propres de l'opérateur A. Simplifions la situation en admet- 
tant que c'est possible. Chaque fonction propre de A associée à la valeur 
propre a est fonction propre de A 2 de valeur propre a 2 . Réciproquement, 
si a 2 est valeur propre de A 2 alors a est valeur propre de A. Il suffit 
de voir que si ip est fonction propre de A 2 alors tp + -A(if)) est fonction 
propre de A. Cela signifie que la grandeur physique a 2 sera associée à 
l'opérateur A 2 . On pourrait faire le même raisonnement et constater que 
l'opérateur associé à a n est A n pour n G N. Par extension, si / est une 
fonction analytique, on voit que l'opérateur associé à f(a) est f(A). De la 
même manière, si a et b sont des grandeurs physiques dont les opérateurs 
associées sont A et B alors on pourra se dire que la grandeur f(a, b) sera 
associée à l'opérateur f(A, B). En fait, ce n'est pas tout à fait vrai parce 
qu'il est possible que les opérateurs A et B ne commutent pas. C'est un 
problème dont nous ne nous occupons pas maintenant mais qui aura une 
véritable importance en mécanique quantique. 
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(3) En vertu de la remarque précédente, on peut maintenant calculer facile- 
ment l'incertitude de la mesure de < a > en posant 

Aa 2 :=< a 2 > - < a > 2 



où < a 2 > est calculée avec (III. 26|) et avec l'opérateur A 2 . Après coup, 



nous en déduisons que si on a mesuré < a >= a à l'instant t, l'hypothèse 
que l'on a faite en disant que ip(-,t) doit être une fonction propre de A 
avec valeur propre a conduit à avoir à la fois < a >= a et Aa 2 = 0, qui 
est exactement ce qu'on voulait. 

(4) Encore une fois, considérons un opérateur Â associé à une grandeur physi- 
que a et écrivons (si c'est possible : voir le théorème III. 891 de l'appendice 
IB1 ainsi que les corollaires qui en découlent) ip = a a ip a où (a a ) a est 
la famille des valeurs propres de A et où ip a est la projection orthogonale 
dans L 2 sur le sous-espace propre associé à a a . Les sous-espaces propres 
étant orthogonaux deux à deux, on a 



Jr 3 " Jm 



\lp a \ 2 dx. 



Cela conduit à interpréter J R3 \ip a \ 2 dx comme la probabilité de trouver a a 
en faisant une mesure de la grandeur physique a. 

En résumé, nous énonçons 
Principes 3a : 

- Si l'on fait une mesure d'une grandeur physique a associée à un opérateur A, 
nous supposerons que la fonction d'onde ip{-,t) est une fonction propre de A. 

- Les seules mesures expérimentales possibles de < a > sont des valeurs propres 
de Â. 

- l'opérateur associé à la grandeur /(a) (f étant une fonction raisonnable) est 
l'opérateur f(A). 

Terminons le paragraphe par la remarque suivante : si on considère une particule 
isolée (i.e. le potentiel V ne dépend pas de t), l'énergie cinétique sera donnée 
par l/2m\v \ 2 = ^~ où p = mv est la quantité de mouvement de la particule. 
L'opérateur associé à l'énergie cinétique est donc en vertu de ce qui précède égal à 

1 

2m 1 

où A = |V est l'opérateur associé à p. On obtient donc que 

Êc = ~ d 3 )\ 2 

— — —A. 

2m 

De plus, par définition, l'énergie potentielle de la particule est égale à V et il n'y 
a aucune incertitude sur cette valeur puisqu'elle ne dépend que de V. Autrement 



E C = —\A 
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dit, l'opérateur associé est Ê p t/j := Vip ce qui donne bien 

< V >= V et AV 2 = 0. 

Puisque l'énergie totale du système est égale à la somme de l'énergie cinétique et 
de l'énergie potentielle du système, l'opérateur associé à l'énergie totale du système 
doit être 

H = Ê C + Ê P = — —A + V (11.30) 
2m 

qui est exactement ce que nous avions déjà postulé au début du paragraphe en 
nous basant sur d'autres considérations. 



CHAPITRE III 



Principes de la mécanique quantique 

Dans le chapitre précédent, nous avons expliqué les intuitions physiques qui ont 
conduit à définir la mécanique ondulatoire. Nous allons maintenant oublier la phy- 
sique et nous concentrer sur les mathématiques. Nous verrons qu'il est naturel 
de simplifier la théorie. C'est ce qui conduira à poser les principes de mécanique 
quantique qui seront donc plus simples à manier d'un point de vue mathématique 
mais plus éloignés de la réalité physique dans leur formulation. C'est pourquoi il 
est nécessaire pour comprendre les aspects physiques de la mécanique quantique 
d'avoir auparavant compris la mécanique ondulatoire. 



1. Principes de base et premières conséquences 

1.1. Les principes. Résumons ce que nous avons fait jusqu'à présent en 
mécanique ondulatoire : un système physique est décrit par une fonction d'onde ip 
définie sur R 3 x R, à valeurs complexes et solution de l'équation de Schrôdinger. 
La fonction t) décrit l'état du système à l'instant t. Chaque grandeur physique 
a est associée à un opérateur A et la mesure moyenne de a est donnée par 

< a >= / t/j(Âip)dx. 
Jr 3 

Cette intégrale n'est rien d'autre que le produit hermitien L 2 (■?/>, Aip). Par ailleurs, 
nous avons vu que pour que la grandeur physique a 2 soit associée à l'opérateur 
A 2 , il fallait décomposer la fonction d'onde dans la "base" des fonctions propres 
de A. Pour finir, nous avons vu le rôle joué par les transformées de Fourier qui 
sont en un sens la décomposition des fonctions sur la "base" non dénombrable des 
e lx . Ces considérations nous amènent à considérer la fonction d'onde ip comme 
étant un vecteur d'un espace de Hilbert hermitien où nous pourrons alors parler 
de décomposition dans une base hilbertienne, de produit hermitien et d'opérateurs, 
qui sont tous les ingrédients que nous avons utilisés jusqu'à présent. Plus précisément, 
nous allons poser 

PRINCIPE I : principe de superposition 

A chaque système physique est associé un espace de Hilbert hermitien en et à une 
fonction ip : R — > tu (la fonction d'onde) qui vérifie pour chaque t, = 1. Le 
terme "fonction d'onde" n'est plus adapté à la situation : on dira plutôt que ip est 
le vecteur d'état du système. 
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Remarque III. 31. Dans cette partie, nous utilisons les notations mathématiques 
usuelles qui sont un peu différentes de celles généralement utilisées par les physi- 
ciens. Nous reviendrons ultérieurement sur ce point. 

Pour que la situation soit bien claire, en mécanique ondulatoire, l'espace en était 
l'espace des fonctions L 2 sur M 3 . Nous choisissons donc simplement d'une part de 
ne plus nous limiter à tu = L 2 et d'autre part à utiliser le langage des espaces 
de Hilbert. Ce point de vue a de nombreux avantages que nous exposons dès 
maintenant : 

(1) d'abord, les notations sont beaucoup plus simples. Par exemple, il est 
beaucoup plus pratique d'écrire (ip,Âip) plutôt que J R3 i/j(At(j)dx. Les cal- 
culs gagneront en limpidité. Nous verrons aussi que les grandeurs phy- 
siques seront modélisées par des opérateurs de e# sans doute plus facile 
à appré-hender et à manier que les opérateurs différentiels utilisés en 
mécanique ondulatoire (par exemple pour modéliser la quantité de mou- 
vement). 

(2) Le fait de travailler sur M 3 fixait implicitement un système de coordonnées. 
Or dans la plupart des situations physiques, il n'y a pas de système de 
coordonnées canonique. Dans le cadre plus général de la mécanique quan- 
tique, nous ne sommes pas contraints à de tels choix. 

(3) Dans de nombreux cas de figure, nous n'avons pas besoin de manipuler 
des objets aussi compliqués que des fonctions L 2 . Dans certaines situa- 
tions, nous pourrons même travailler dans un espace de Hilbert à deux 
dimensions. Cela simplifie considérablement les problèmes et nous permet 
de nous concentrer sur les grandeurs physiques qui nous intéressent. 

(4) A posteriori, nous verrons que c'est cette formulation plus générale qui 
permettra de mettre en évidence le " spin" , grandeur intrinsèque à la par- 
ticule et purement quantique, c'est-à-dire qui ne possède aucun analogue 
en physique classique ni même en mécanique ondulatoire. 

Une fois ces bases établies, il s'agit de réécrire les principes de mécanique ondula- 
toire avec ce nouveau langage. 

PRINCIPE II : mesure des grandeurs physiques 

a) A toute grandeur physique a est associé un opérateur auto-adjoint A : 
£h — > £h- On dit que A est /'observable qui représente la grandeur a. 

b) (principe de quantification) On mesure à l'instant t une grandeur physique 
a d'observable A. Quel que soit l'état du système, c'est-à-dire quel que soit 
le vecteur d'état ip, le résultat de la mesure obtenue sera une valeur propre 
de A (réelle d'après la proposition \II. 88\ de l'appendice [Bjj . 

c) (principe de décomposition spectrale) Notons (a a ) a les valeurs propres 
de l'observable A. Soit ip le vecteur d'état du système. La probabilité de 
trouver a a en mesurant la grandeur physique a a à l'instant t est égale à 
\\ip a \\ 2 oùipa est la projection orthogonale de ip(t) sur le sous- espace propre 
de A associé à la valeur propre a a . 
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d) Immédiatement après avoir mesuré la valeur a a à l'instant t, le nouvel 
état du système est p^rr- Plus précisément, si P a est le projecteur sur le 
sous-espace propre associé à a a , on a if)(t) = P a (\im s ^ t - P a (ip(s)) 

Remarque III. 32. Il y a quelques remarques à faire sur le principe Ile). De 
manière sous-jacente, il faut que probabilité totale des mesures possibles soit 
égale à 1 et donc qu'on puisse trouver une base hilbertienne dénombrable de vec- 
teurs propres. C'est possible pour un grand nombre d'opérateurs (par exemple les 
opérateurs compacts : voir le théorème III. 891 dans l'appendice [B] ainsi que les co- 
rollaires qui en découlent) mais pas pour tous. En particuliers, les opérateurs qui 
représentent une grandeur physique quelconque peuvent ne pas être bornés : c'est 
le cas en mécanique ondulatoire avec les opérateurs position, quantité de mouve- 
ment et énergie. Malgré tout, nous gardons ce principe tel quel d'abord parce qu'il 
finira par fournir un modèle très efficace qui prédit avec une grande exactitude ce 
qui se passe, ensuite parce qu'il y aura moyen de construire la théorie en étant 
plus rigoureux : il faut pour cela considérer des vecteurs propres "extérieurs à £#". 
On trouvera dans l'appendice [B] (paragraphe 12.31) une discussion sur le sujet. Une 
deuxième remarque justement liée à cette discussion est la suivante : le principe 
Ile) est énoncé pour un opérateur A dont le spectre est discret mais peut être 
extrapolé à des opérateurs à spectre continu. Dans le cas discret, l'idée est d'écrire 
ip = ^adaipa où (a a ) a est la famille des valeurs propres de A et où ip a est la 
projection orthogonale sur le sous-espace propre associé à a a . Les sous-espaces 
propres étant orthogonaux deux à deux, on a 



al 



C'est pourquoi on pose comme principe d'interpréter HV'all 2 comme la probabilité 
de trouver a a en faisant une mesure de la grandeur physique a. Si maintenant A est 
à spectre continu (comme c'est le cas pour l'observable position), on interprétera là 
aussi if) a comme une densité de probabilité. Par exemple, si [x, y] est un intervalle 
de valeurs propres, la probabilité de faire une mesure dont la valeur est comprise 
dans [x, y] sera 

ry 

\ip z \ 2 dz 



où ipz est la projection de if) sur l'espace propre associé à z. Notons aussi que pour 
de tels opérateurs, les mesures obtenues ne sont pas quantifiées. Par exemple, en se 
plaçant dans le cadre de la mécanique ondulatoire, l'observable z-ème coordonnée 
de la position est donnée par Aip(x) = Xiip(x). Autrement dit, tout vecteur x est 
valeur propre de A et le vecteur propre associé est la fonction ip x qui vaut 1 en ï 
et ailleurs. Le projeté de ip sur l'espace propre associé à x est ip(x). Une autre 
manière de le dire est que le projecteur associé est la distribution de Dirac en x 
(lire à ce propos la discussion 12.31 dans l'appendice [Bl. Si A C M 3 , la probabilité de 
mesurer une position dans A est J A \ijj(x)\ 2 dx et on retrouve bien l'interprétation 
densité de probabilité de la fonction \ip\ 2 . Notons que mathématiquement, ce que 
l'on vient de faire n'est absolument pas rigoureux puisque dans L 2 , une fonction 
nulle partout sauf en un point est égale à la fonction nulle. 
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III. PRINCIPES DE LA MÉCANIQUE QUANTIQUE 



Il faut maintenant donner l'équation d'évolution du vecteur d'état i/j. En s'inspirant 
de la mécanique ondulatoire, on posera le principe suivant : 

PRINCIPE III : évolution du système Soit v/j(t) le vecteur d'état à l'instant 
t. Tant que le système n'est soumis à aucune observation, son évolution au cours 
du temps est régie par l'équation de Schrôdinger 



où H est l'observable énergie. 

Remarquons qu'il n'y a plus de laplacien ici mais que l'on suppose qu'à chaque 
situation physique est associée une "observable énergie H" qui n'est pas donnée 
a priori. Pour finir avec les principes fondamentaux, on va essayer de donner une 
règle de base en ce qui concerne le choix de l'espace de Hilbert Eu- On a vu en 
mécanique ondulatoire que le bon cadre pour décrire le mouvement d'une particule 
dans M 3 était de travailler dans L 2 (K 3 ) (où les fonctions sont à valeurs complexes). 
On aurait pu aussi travailler dans L 2 (IR) ou dans L 2 (R 2 ) si on avait étudié le 
mouvement de la particule le long d'un axe ou dans un plan. Dans un sens, chaque 
coordonnée (on parle plutôt de degré de liberté) s'étudie séparément. De même si 
on avait travaillé avec deux particules évoluant dans M 3 (donc avec six degrés de 
liberté), on aurait travaillé dans L 2 (M 6 ). Rappelons que L 2 (M) est séparable, une 
base hilbertienne étant donnée par les polynômes de Hermite : 



De même, L 2 (W) est séparable et une base hilbertrienne est donnée par 

(H kl (g) • • • (g) H hr ) klt ... jkre ^ 

où l'on rappelle (voir le paragraphe S] de l'appendice |B]) que pour (xi, • • • , x r ) G C k , 
on a 

H kl ® ■ ■ ■ ® H kr (xi, - ■ ■ ,x r ) := H kl (xi)H k2 (x 2 ) ■ • -H kr (x r ). 
Autrement dit, L 2 (W) = L 2 (W) <g) • • • (g>L 2 (lR) (r fois). Il est donc naturel de poser 
le principe suivant : 

PRINCIPE IV : degrés de liberté Chaque degré de liberté est décrit dans 
un espace de Hilbert. Lorsqu'un système physique possède N degrés de liberté, on 
considérera que l'espace de Hilbert du système sera le produit tensoriel des N es- 
paces de Hilbert associés à chacun des degrés de liberté. 

1.2. Notations et vocabulaire de Dirac. Dans ce texte, nous utilisons le 
langage et les notations usuelles des espaces de Hilbert. En particulier, tout élément 
if) de l'espace de Hilbert Eu peut-être vu ou bien comme un vecteur ou bien une 
forme linéaire continue en posant ip* = (ip,-)- Remarquons d'ailleurs que toute 
forme linéaire continue de Eu peut s'écrire de cette manière : c'est le théorème de 
représentation de Riesz HT7851 présenté en appendice. En physique, si if) G Eu, on 
parlera 

- de ket lorsque if) sera vu comme un vecteur et on a coutume de noter > à la 
place de ip ; 



ihd t ip = Hifj 



(111.33) 
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- de bra lorsque ip est vu comme une forme linéaire continue. La notation habituelle 
est alors < 

En général, le produit hermitien de x, y G Eh est noté < x\y > et les notations 
précédentes indiquent qu'un ket est moralement "à droite" du produit hermitien 
tandis qu'un bra est "à gauche" . 

1.3. Conservation de la norme. Nous avons défini un vecteur d'état comme 
un vecteur unitaire dépendant du temps. Comme c'était le cas en mécanique ondu- 
latoire, l'équation de Schrôdinger permet de montrer la conservation de la norme 
avec le temps. On a en effet, en notant ip le vecteur d'état : 



L'opérateur H étant auto-adjoint, on trouve que cy-?/>|| 2 = 0. 

2. Prédictibilité de l'évolution d'un système : le chat de Schrôdinger 

Il est naturel de se poser la question suivante : est-ce qu'il est possible de prédire 
l'évolution d'un système physique en l'observant à un instant donné? Des prin- 
cipes de base, on peut tirer deux conclusions pour répondre à cette question : 

1) la première consiste à remarquer que tant que l'on ne fait pas de mesure, 
l'évolution du système est régie par l'équation de Schrôdinger qui est complètement 
déterministe. Afin de s'en convaincre, on va le montrer lorsqu'on est en présence 
d'un système isolé, c'est-à-dire un système dont l'observable énergie H ne dépend 
pas du temps. Dans ce cas, notons E a les valeurs propres de H et ip a les vecteurs 
associés. Nous avons vu que l'un des principes de base de la mécanique quantique 
consistait à supposer que les vecteurs propres des observables formaient une base 
hilbertienne de En- Remarquons que c'est de toute manière très justifié en ce 
qui concerne l'observable énergie puisqu'en mécanique ondulatoire, on avait H = 
— t^A + V et que cet opérateur possède bien une base hilbertienne de vecteurs 
propres dans L 2 . On note À Q (t) les coefficients du vecteur d'état ïp(t) dans son 
écriture dans la base hilbertienne (ip a ) a autrement dit : ip(t) = 'Y^\ a {t)il' a . On a 
alors d'après l'équation de Schrôdinger et puisque par définition H = E a ip a : 



d t u\\ 2 = (d t ^^) + (^d^) 

= (- l -HiJ;,i;) + ^,- l -H) 
= i(jfy,^)-ity,^). 



8 t m 





Puisque par ailleurs 
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on obtient en identifiant que 

\*(t) = ~Xa(t)E a 

c'est-à-dire X a (t) = X a (0)e^ Eat et donc 

m = Y, x °(°) e{Eat i>°- ( IIL34 ) 

L'état du système à l'instant t ne dépend donc que de l'état du système à t — 0. 



2) la seconde conclusion que nous pouvons déduire des principes de base est qu'une 
mesure brise la prédictibilité "passée" du système. Plus précisément, en connais- 
sant l'état du système juste après une mesure, on ne peut pas connaître l'état du 
système juste avant cette mesure. En effet, en notant encore une fois À a les valeurs 
propres de H et ip a les vecteurs propres associés (qui peuvent dépendre du temps 
si le système n'est pas isolé), ip(t) se décompose à l'instant t 

Si maintenant on effectue une mesure en t' > t, les principes de base disent qu'on 
aura 

W = ÏTTÏÏ 

à l'instant t'. En particulier, on n'a absolument aucune indication pour retrouver 
les coefficients \ a apparaissant à l'instant t. 



Remarquons maintenant que les deux conclusions que nous venons de présenter 
semblent conduire à un paradoxe. Considérons un système physique S pour lequel 
on possède un détecteur D qui mesure une certaine quantité physique a. Il y deux 
façons possibles de voir les choses : 

(1) on peut d'abord considérer le système S comme nous l'avons fait ci-dessus. 
Le fait de faire une mesure brise la prédictibilité du système. 

(2) On peut aussi, considérer le système formé de S et de tous les atomes du 
détecteur D. Dans ce cas, le détecteur n'influe plus sur le système qui est 
donc régi par l'équation de Schrôdinger. 

Ces deux visions des choses semblent aboutir à une contradiction. En fait, dans 
la deuxième version, c'est la lecture du détecteur qui joue le rôle de la mesure. 
Autrement dit, il faut considérer que l'on travaille dans l'espace de Hilbert Es®£d 
où es et Sd sont les espaces de Hilbert respectivement associés à S et D. Juste 
avant la mesure, le vecteur d'état du système s'écrira 

i){t) = ^a a S a ®D p 

où l'on a décomposé le vecteur ip{t) dans une base hilbertienne de vecteurs propres 
de l'observable A <g> D où A est associé à la grandeur physique a et où -D est associé 
à grandeur physique "affichage du détecteur". Le fait de lire ce qui est marqué sur 
le détecteur donnera à la fois une mesure de la grandeur physique a ainsi que 
l'affichage du détecteur. C'est une remarque intéressante parce qu'elle montre que 
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les phénomènes macrospiques doivent aussi être soumis aux lois de la mécanique 
quantique si l'on veut éviter les paradoxes. On résume ce phénomène en disant 
qu'avant de lire le détecteur, l'état du système est une superposition de plusieurs 
états où le détecteur affiche des résultats différents. Dans les livres de vulgarisation, 
on présente en général les choses en disant qu'un chat est enfermé dans une boîte 
dans laquelle se trouve un système létal dont le déclenchement est aléatoire. Dans la 
perception classique, on aura tendance à dire qu'avant d'ouvrir la boîte, il existe 
une réponse à la question : " le chat est-il mort ou vivant ?" , c'est-à-dire qu'à 
tout instant donné, le chat est soit mort soit vivant. En mécanique quantique, 
on supposera que l'état du système est une superposition de l'état "chat mort" 
et l'état "chat vivant". Ce n'est qu'au moment où la boîte est ouverte qu'un des 
deux états se décide. 

2.1. Conservation de l'énergie. Par définition, l'énergie totale du système 
est E(t) = (ipiHip). Si le système est isolé, c'est-à-dire si H ne dépend pas du 
temps, on a : 

d t E(t) = (d t iP,HiP) + (iP,Hd t iP). 
En utilisant le fait que H est auto-adjoint et l'équation de Schrodinger, on a 

d t E(t) = (~HiP, ify) + (ifV, H^) 
= 0. 

On retrouve le principe de conservation de l'énergie totale d'un système isolé. 



3. Commutateurs des observables 

3.1. Postulats. Soient Â, Ê deux observables. A priori, il n'y a aucune raison 
pour que ces deux opérateurs commutent. C'est la raison pour laquelle on introduit 
leur commutateur 

[Â,ê] := ÂB-BÂ. 

Par ailleurs, il n'y a aucun moyen de déduire ces commutateurs des principes 
de base décrits plus haut. Il faut donc les postuler. Pour certains d'entre eux, 
on peut se baser sur ce qui a été fait en mécanique ondulatoire. Par exemple, 
notons Xi les observables associées aux composantes du vecteur position, p i ceux 
associés aux composantes du vecteur quantité de mouvement. On rappelle qu'en 
mécanique ondulatoire, Xj est simplement la multiplication par x iy que pi = kd Xi 

et que H = — + V. Ainsi, les £i commutent entre eux ainsi que les pi et aussi 
Xi et pj si i 7^ j. Par contre, 

%iPi Pi%i ~%idxi(') ~dxi(%i') 7' 
% % % 



et aussi 



h 2 r h 2 h 2 

XiH — Hxi = XsAf-) H A(av) = — d x . 

2m W 2m K 1 J 2m Xl 
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En résumé, on supposera en mécanique quantique : 



POSTULAT III. 35. Pouri,j, on fait les hypothèses : 



[xi,Xj\ = \pi,Pj] = 0, 



[Xi,Pj\ 



et enfin 



si i 7^ j 
—ih si i = j, 



h 2 



\xi, H] = — d x .. 

2m 1 



Les relations de commutation jouent un rôle fondamental dans la théorie : il est 
même très fréquent qu'on ne définisse un opérateur que par ce type de relations. 
Nous allons donner quelques exemples d'applications. 



3.2. Principe d'incertitude. Soit A une observable associée à une grandeur 
physique a. Par principe, la moyenne < a > de a sera 

< a >= (ip,Âip). 

La variance Aa 2 =< a 2 > — < a > 2 sera donc 

(^,(i 2 -<a>» = (^,i^) 

où l'on définit pour toute observable A, Âq := A— < a >. De cette observation et 
du postulat ci-dessus, on déduit aisément le principe d'incertitude. On utilise pour 
cela l'inégalité de Cauchy-Schwarz qui dit que pour tous u,v G on a |(w,f)l — 
\\u\\ \\v\\. On remarque aussi que pour deux observables A, B, on a [A, B] = [A , B }. 
On a donc, en utilisant le postulat ci-dessus : 

hh= \ih\\4>\\ 2 \ 

= |(^, [Xi,Pi]lf>)\ 

= |(^,p i ) ,(p i )o]^)| 

= |((£i)o, (Pi)o^) + ((Pi)o, (Xi)o^)\ 

< 211(^1111(^11 

< 2(^,(x i )^)(^,(Pi)^) 

< 2Ax 2 Ap 2 

On retrouve donc le principe d'incertitude de mécanique ondulatoire : 



Ax 2 Ap 2 > h/2. 



(111.36) 
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3.3. Théorème d'Ehrenfest : conservation de la quantité de mou- 
vement. Soit A une observable associée à une grandeur physique a (qui peut 
dépendre du temps). En dérivant termes à termes et en utilisant l'équation de 
Schrodinger puis le fait que les opérateurs sont auto-adjoints, on voit immédiatement 
que 

d t < a >= dtty, iV) = [Â H]tfj) + (</>, d t ^). (111.37) 

Cette relation, bien qu'évidente, est connue sous le nom de théorème d'Ehrenfest. 
Supposons que l'observable A ne dépende pas du temps et commute avec H. Alors 
la quantité physique a (en fait sa moyenne < a >) est conservée dans le temps. 
C'est par exemple le cas lorsque a = pt, projection de la quantité de mouvement sur 
les axes et lorsqu'on est dans le cas d'un système isolé (d t H = 0) et d'une particule 
libre. On rappelle qu'une particule libre est une particule qui n'est soumise à aucun 
potentiel V. L'énergie totale est alors égale à l'énergie cinétique 

jp 1 , 2 PÏ+P2+ PÎ 

h = 1/mv = . 

' 2m 

En mécanique quantique, on choisit donc de lier H et pi par 

fi . = gj + Pl + PÎ 
2m 

On en déduit du postulat IIII.35I que les pi commutent avec H ce qui implique la 
conservation de la quantité de mouvement. 



CHAPITRE IV 



Du moment cinétique à la définition du spin 



Nous essayerons de donner une définition la plus simple possible du moment 
cinétique interne des atomes dans le cadre de la mécanique quantique. En étudiant 
le spectre de l'observable ainsi définie, nous nous apercevrons que certaines valeurs 
propres (donc des valeurs potentiellement mesurables) ne peuvent pas provenir du 
moment cinétique orbital des particules constituantes de l'atome. Il y a donc deux 
possibilités : ou bien ces valeurs propres ne sont la traduction d'aucune réalité 
physique ou au contraire, elles correspondent à ce qui doit être une sorte de mo- 
ment cinétique intrinsèque à chaque particule de l'atome. L'expérience de Stern et 
Gerlach montrera que c'est la deuxième solution qui est la bonne. Cette nouvelle 
grandeur physique des particules sera appelée spin. 



1. Moment cinétique d'une particule en physique classique 

Considérons une particule massive en mouvement dans M 3 modélisée par un point 
M. On définit son moment cinétique autour d'un point O fixe par 

où A est le produit vectoriel de M 3 et où ~p* est la quantité de mouvement de 
la particule. Chaque composante de ~t mesure la "quantité de mouvement de 
rotation" autour de l'axe correspondant. Par exemple, supposons que la particule 
tourne dans le plan z = où le point O a été pris comme origine et où (x, y, z) 

sont les coordonnées sur R 3 , alors les coordonnées L x et L y de L sont nulles 

puisque par définition L est orthogonal à OM et à ~p* et donc au plan z = 0. 
Notons aussi que si dans ce plan, M ne tourne pas autour de O, autrement dit, 
si OM et ~p* sont colinéaires, alors ~t = 1? . Dans le plan z = 0, on peut utiliser 
les coordonnées polaires. On a donc OM = r(cos(0), sin(O), 0) et ~p* — mlï = 
m{r' cos(O), r' sin(O), 0) + mrO'(— sin(O), cos(O)). On trouve ainsi que 









= masse • I 


\ mrO' I 





L = I I = masse • I 






vitesse de rotation 

et c'est pourquoi L s'interprète comme une quantité de mouvement de rotation. 
Il faut remarquer que la définition dépend du point O. 



De par sa définition, le moment cinétique joue un rôle important en mécanique du 
solide. Mais il intervient de manière encore plus fondamentale lorsqu'on cherche 
à étudier la structure interne de la matière. En effet, de manière grossière, un 
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atome est constitué délectrons gravitant autour d'un noyau. Leur mouvement de 
rotation, mesuré par leur moment cinétique que l'on qualifie dans cette situation 
de mouvement cinétique orbital, induit un champ magnétique qui interagit avec 
le champ magnétique environnemental. Le moment cinétique orbital est donc une 
composante intrinsèque de l'atome qui avec sa charge lui confère ses propriétés 
électromagnétiques. 

2. Définition du mouvement cinétique en mécanique quantique 

Une manière de construire les observables de grandeurs physiques de la mécanique 
quantique est de s'appuyer sur leur définition classique. Par exemple, le moment 
cinétique peut se définir par la formule L — xAp. On pourra donc poser 

L\ = x 2 p 3 - p 2 x 3 = [x 2 ,P3\; 

L 2 = x 3 p 1 -p 3 x 1 =[x 3 ,px]] 

L 3 = xip 2 - pix 2 = [xi,p 2 ] 
ce qui se notera 

L = xAp. (IV.38) 

Cette façon de procéder a l'inconvénient d'être rigide puisqu'elle oblige à définir 
les Xi et les pi et impose aussi l'espace de Hilbert dans lequel on travaille. L'autre 
façon de procéder, et qui sera le plus souvent féconde, sera de définir les observables 
uniquement par leurs commutateurs. Par exemple, on peut définir les opérateurs 
Xi et pi uniquement avec le postulat IIIL35I énoncé au chapitre précédent. Nous 
avons vu que ces seules informations sont suffisantes pour retrouver des propriétés 
physiques importantes comme la conservation de la quantité de mouvement d'une 
particule libre et le principe d'incertitude. On décide donc de suivre cette démarche. 
On déduit immédiatement du postulat IIII.35I que si l'on définit L avec ( 1IV.38I) . on 
a 

L AL — ihL. 

Les coordonnées de cette relation donnent les [Li,Lj]. C'est sur cette définition 
que nous allions nous appuyer pour définir les moments cinétiques en mécanique 
quantique. Il est usuel de les noter J. 

DÉFINITION IV. 39. En mécanique, une observable de moment cinétique est une 
observable vectorielle J vérifiant 

J A J = ihJ. (IV.40) 

3. Spectre d'un moment cinétique 

Dans ce paragraphe, nous étudions le spectre d'une observable de moment cinétique. 
Nous discuterons de ses conséquences physiques dans les paragraphes suivants. 

Proposition IV.41. Soit 
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une observable de moment cinétique où Von a noté (x,y,z) les coordonnées de M 3 . 
On définit] 2 := \\J\\ 2 := J 2 + J 2 + J 2 . Alors, 

(1) Les valeurs propres de j 2 sont de la forme j(j + l)h 2 où j G |N. 

(2) Les valeurs propres de J x , J y et J z sont de la forme mh où m G |Z. 

(3) Soient mh, m G |Z une valeur propre de J z ( on pourrait prendre J x ou 
J y ) et j(j + l)h 2 , j GG |Z une valeur propre de j 2 . Alors 

m G {-j, -j + 1, • • ■ , j - 

Démonstration 

On va travailler avec J z , les cas de J x et J y se traitant de manière analogue. 
D'abord, on calcule à partir des relations (1IV.40j) que [j 2 , J z ] =0. Cela implique, 
d'après le théorème III. 961 de l'appendice [Bj qu'il existe une base hilbertienne de 
vecteurs propres communs à j 2 et J z . Les valeurs propres de j 2 étant positives 
(puisque j 2 est associée à une grandeur physique positive), on peut les écrire sous 
la forme j(j + l)h 2 où j G M. De même celles de J z s'écrivent sous la forme mh. On 
notera ipj >m un vecteur propre associé simultanément aux valeurs propres j(j + l)h 2 
de j et mh de J z . Le but est de montrer que j, m G 1/2Z. On introduit maintenant 
les opérateurs 

J -|- . J ■£ | % J y J — . J ■£ 1 J y • 

Ces opérateurs ne sont pas auto-adjoints : on a J± = J T . Des relations de commu- 
tations fHV.40j) . on tire 

[j 2 , J±] = et [J z , J±] = ±hJ±. (IV.42) 
On en déduit que, pour j, m fixés tels que ij)j, m existe, on a : 

fj±^j,m = J±f^j,m = j(j + l)h 2 J ± ^^ m . 

et 

Jzj±Tpj,m = {J±Jz ± hJ ± )lp jjm = (m ± l)hJ±1p jjm 

ce qui fait que J±ipj t m, s'il est non nul, est un vecteur propre commun aux opérateurs 
j 2 et J z associé aux valeurs propres j(j + l)h 2 et (m±l)h. Considérons maintenant 
l'ensemble 

Q := U±ip j>m \k G N} . 

Cet ensemble est constitué de vecteurs qui sont tous dans le même espace propre 
de j 2 et qui sont propres pour J z associés à des valeurs propres de la forme ah où 
a G m + Z. Physiquement, il est raisonnable de penser que seul un nombre fini 
de vecteurs de fl sont non nuls puisque que J z est une observable mesurant une 
coordonnées de moment cinétique tandis que j 2 est une observable mesurant la 
norme du même moment cinétique. On va montrer rigoureusement ce résultat. On 
écrit 

En uilisant que J T J± = j 2 — J 2 =F hJ z , on obtient 

||4V>i;m|| 2 = + 1) - m(m ± l))ft 2 ||^, m || 2 (IV.43) 



36 



IV. DU MOMENT CINÉTIQUE À LA DÉFINITION DU SPIN 



ce qui prouve que, puisque || J±ipj ;m \\ 2 > 0, 

-j<m<j (IV.44) 

On remarque aussi que si m ^ ±j, J±i/jj tm 7^ 0. On peut réécrire (IIV.43P en 
remplaçant ipj m par J±^j, m et faire le même raisonnement. Une récurrence évidente 
dit que, puisque fl est fini, il existe des entiers k, k' tels que m+k = j et m—k' = —j 
(sinon, J±(if)j >m ) n'est jamais nul). En soustrayant ces inégalités, on obtient que 
2 j = k + k' et donc j G |Z. On en déduit aussi que m G |Z ce qui démontre la 
proposition. □ 



4. Mouvement cinétique orbital 

Dans le paragraphe précédent, nous avons travaillé avec un moment cinétique défini 
par ( II V. 40 p . Cette définition est purement mathématique : nous avons uniquement 



utilisé les relations de commutation d'un moment cinétique classique. Il est naturel 
de se demander quel est le sens physique de cette définition. Pour cela, replaçons- 
nous dans le cadre de la mécanique ondulatoire avec les obervateurs x, p et on 
définit L par (1IV.38|) . Cette définition plus physique doit correspondre à la situation 
qui nous a inspirés : celle d'une particule, d'un électron en particulier, en orbite 
autour d'un noyau. Un tel moment cinétique sera appelé moment cinétique orbital. 
Nous montrons que 

PROPOSITION IV. 45. Soit L un observable de moment cinétique orbital. Notons 
L x , L y et L z les observables "coordonnées" associées. Leurs valeurs propres sont 
de la forme mh où m G Z. 

Démonstration 

Comme dans le paragraphe précédent, nous travaillons seulement avec L z . La 
définition (1IV.38|) ainsi que les observables de position et de quantité de mouvement 



de la mécanique ondulatoire nous disent que 

L z = ih(xd y - yd x ). 

On prendra garde au fait qu'ici, (x, y, z) sont les coordonnées sur M 3 tandis que dans 
pV.38p . x représente l'observable vectoriel position. En utilisant les coordonnées 
sphériques (r, ip, ©) sur M 3 , on voit que 

L z = -m v . (IV.46) 

Soit Tp m (r, (p, O) - nous n'écrivons pas la dépendance en temps - une fonction d'onde 
propre pour L z , c'est-à-dire vérifiant 

L z ïp m = mhijjm 

où m G M. L'écriture (1IV.46|) permet de dire que ipm est de la forme 

^ m (r,^,0) = ^ m (r,e)e îmv . 

Puisqu'en coordonnées sphériques, (r, <p, O) = (r, (p+2ir, O), il faut que V'mfr, y?, O) = 
ip(r, ip + 2tt, O) ce qui montre que m doit être entier. □ 



6. EXPÉRIENCE DE STERN ET GERLACH 
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5. Interprétation physique des propositions [TV. 411 et IIV.45I : spin d'une 

particule 

La proposition (jiV.4ip dit que les valeurs propres des coordonnées d'un moment 
cinétique défini par (1IV.40j) sont de la forme mh où m G 1/2Z. Autrement dit, 



ce sont les seules valeurs que l'on peut mesurer expérimentalement. D'après la 
proposition IIV.45} celles de ces valeurs qui ne sont pas entières ne peuvent pas 
caractériser des mouvements cinétiques orbitaux. Il y a donc plusieurs solutions : 

(1) ou bien ces valeurs non entières ne sont pas valeurs propres : nous avons 
en effet montré que toute valeur propre était de la forme mh où m G 1/2Z 
mais nous n'avons pas montré que toutes ces valeurs étaient effectivement 
des valeurs propres ; 

(2) ou bien ces valeurs sont des valeurs propres mais ne caractérisent aucune 
réalité physique : il est en effet raisonnable d'imaginer que la définition 
flIV.40p . basée uniquement sur des relations de commutation, n'est pas 
la bonne. N'oublions pas que le passage de la mécanique ondulatoire à 
la mécanique quantique s'est fait en oubliant un peu la physique et en 
mathématisant la théorie ; 

(3) ou bien ces valeurs sont des valeurs propres et caractérisent une grandeur 
physique qui n'a donc aucun analogue classique. 

C'est l'expérience de Stern et Gerlach qui va trancher la question : c'est la troisième 
version qui est la bonne. Les valeurs demi-entières mesurent une quantité phy- 
sique que l'on appelle spin et qui est une propriété intrinsèque des particules. 
On l'étudiera plus en détail dans le chapitre suivant. Son interprétation physique 
est encore discutée à l'heure actuelle. Certains l'imaginent comme une rotation 
d'une particule sur elle-même mais cette vision des choses n'est pas satisfaisante à 
bien des égards. On peut d'ailleurs se poser la question : est-elle réellement le re- 
flet d'une quantité humainement imaginable comme une rotation ? Ce n'est pas du 
tout évident et on pourrait penser qu'il s'agit simplement d'une grandeur purement 
mathématique qui doit être prise en compte lorsque l'on étudie le comportement 
d'une particule. 



6. Expérience de Stern et Gerlach 

La construction est la suivante : on projette des atomes horizontalement dans un 
champ magnétique vertical et on mesure la déviation de la trajectoire sur un écran 
placé un peu plus loin. On peut montrer que l'interaction de l'atome avec le champ 
magnétique provient uniquement de la composante J z du moment cinétique interne 
J. Nous ne rentrerons pas dans les détails pratiques de l'expérience ni même dans 
son interprétation physique exacte. Néanmoins, ce qu'on observe est que les atomes, 
lorsqu'il s'agit d'atomes d'argent, vont frapper l'écran à deux endroits seulement 
de l'écran. On peut raisonnablement penser que l'atome n'a, en termes de moment 
cinétique que deux états possibles, c'est-à dire que l'opérateur J z n'a que deux 
valeurs propres. Cela suggère que le paramètre j de la proposition IIV.41I prend 
la valeur 1/2 avec probabilité 1 et que les valeurs propres de J z sont ±l/2h. On 
pourra aussi à ce propos, lire la remarque IV. 511 Plus généralement, en supposant 
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que le paramètre j soit fixée, on voit que J z a 2j + 1 valeurs propres si j G Z et 
2j valeurs propres si j G 1/2Z \ Z. On observera d'autres exemples d'atomes où 
apparaissent un nombre pair de taches, impliquant des valeurs demi-entières pour 
j et m. Autrement dit, les conclusions que nous avons tirées sont bonnes, ce qui 
sera confirmé par toutes les prédictions expérimentales que nous pouvons en tirer 
et le moment cinétique interne de l'atome d'argent n'est pas uniquement dû à des 
moments cinétiques orbitaux. 

Remarque IV. 47. Il est intéressant de voir la démarche adoptée par les physi- 
ciens face à ce type de problème. Les résultats de l'expérience disent que l'atome 
peut être dans deux états distincts, correspondant chacun à une valeur propre de 
l'observable associée. Il y a donc au moins deux vecteurs propres. On essaye donc 
de voir ce qui se passe en supposant que l'espace de Hilbert associé au degré de 
liberté J z est exactement de dimension 2, engendré par les deux états propres mis 
en évidence par l'expérience. C'est cette démarche qui conduira au formalisme du 
spin 1/2 décrit dans la suite. Les résultats obtenus expérimentalement montrent 
que cette hypothèse est bonne. On est donc dans une situation où l'on travaille 
avec des espaces de Hilbert beaucoup plus simples que L 2 rencontré en mécanique 
ondulatoire et qui justifie encore une fois la formalisme de la mécanique quantique. 



CHAPITRE V 



Le spin et son formalisme 



Le chapitre précédent montrait comment expérimentalement, on pouvait mettre 
en évidence le spin : grandeur purement quantique s'apparentant à un moment 
cinétique interne. Dans ce chapitre, nous allons montrer comment d'une part 
modéliser cette grandeur physique et d'autre part, étudier les conséquences de 
son existence. Nous étudierons ici seulement le spin 1/2. 

1. Définition 

Résumons d'abord les conclusions du chapitre précédent. Le but était de définir 
un moment cinétique en mécanique quantique. Au lieu de nous appuyer sur la 
définition classique de cette grandeur vectorielle, nous avons décidé de définir l'ob- 
servable associée en nous basant uniquant sur les relations de commutation entre 
ses coordonnées. Nous définissions donc un observable J = (J x , J y , J z ) vérifiant les 
relations (IIV.40j) . On observait alors que 

(1) les valeurs propres de l'observable j = J 2 + J 2 + J 2 Z étaient de la forme 
j(j + l)h 2 avec j G 1/2Z; 

(2) les valeurs propres de l'observable J z étaient de la forme mh avec m G 
1/2Z; 

(3) les valeurs non-entières de j et m, dont l'existence physique était mise 
en évidence par l'expérience de Stern et Gerlach, ne pouvaient pas corres- 
pondre au moment cinétique " classique" d'une particule, bien qu'induisant 
un comportant similaire de l'atome en présence d'un champ magnétique. 

Nous avons avons aussi montré expérimentalement que dans le cas de l'atome 
d'argent, l'observable j n'avait en fait qu'une seule valeur propre correspondant à 
j = 1/2 et que l'observable J z n'avait que deux valeurs propres correspondant à 
m = ±1/2. Nous dirons que cet atome a un spin 1/2. Expérimentalement, on peut 
montrer que les particules elles-mêmes, et pas seulement les atomes, possèdent ce 
"moment magnétique propre". Plus précisément, les électrons, protons, neutrons, 
neutrinos, quarks possèdent un spin 1/2. On peut aussi montrer que d'autres par- 
ticules possèdent un spin plus élevé correspondant à d'autres valeurs plus grandes 
de j et m. On classe d'ailleurs les particules selon qu'elles aient ou non un spin 
entier : 

DÉFINITION V.48. Les particules de spin entier sont appelées des bosons et les 
particules de spin demi-entier sont appelées des fermions. 

Malgré tout, nous n'avons toujours donné aucune définition mathématique précise 
du spin. Nous le faisons maintenant, en nous limitant au spin 1/2. 
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DÉFINITION V.49. Les particules pour lesquelles on ne peut mesurer que deux 
états distincts pour chaque coordonnée du moment cinétique propre (par une expéri- 
ence de type Stem et Gerlach par exemple) seront dites à spin 1/2. Cette grandeur 
physique S = (S x , S y , Sz) est un degré de liberté à elle toute seule : elle ne peut pas 
se lire à travers les observables position et vitesse par exemple (contrairement à un 
moment cinétique classique). Ce fait n'est pas du tout évident. On lui attribue donc 
un espace e sp i n de dimension 2 (une dimension pour chaque valeur propre de J z ) 
et un observable vectoriel S = (S x , S y , S z ) vérifiant les relations de commutation 

S A S = ihS (V.50) 

On pose comme principe que chacune des observables S x , S y , S z possède exactement 
les valeurs propres ±l/2H. 

Remarque V.51. 

(1) Puisque les mesures des coordonnées S x , S y , S z ne donnent que les valeurs 
possibles ±l/2h~, la mesure de \\S\\ := S 2 + Sy + S 2 donne la valeur \h 2 = 

j(j + l)h 2 où j = 1/2. En particulier, cela implique que s := S 2 + Sy + S 2 
est égal à ^h 2 Id. 

(2) On pourrait penser que le spin S possède trois degrés de liberté (un 
pour chaque coordonnée) : c'est en fait proscrit par le fait que les ob- 
servables S x , S y , S z ne commutent pas et donc que ces quantités ne sont 
pas indépendantes les unes des autres. Cela dit, le choix de modéliser le 
spin 1/2 par un espace de Hilbert à deux dimensions ne s'impose pas. Il 
se trouve que, puisqu'il y a au moins deux états, cet espace est au moins 
de dimension 2. On fait donc ce choix dans un premier temps pour voir ce 
que l'on peut en déduire. C'est dans un deuxième temps que l'expérience 
viendra confirmer que le modèle est bon. 

Il faut maintenant se poser la question de savoir si la définition ci-dessus peutêtre 
réalisée. Autrement dit, a-t-on, dans un espace de dimension 2 des opérateurs S x , 
S y et S z vérifiant les relations IV. 501 ? La réponse est oui et il est facile de le voir. En 
effet, soit de Hilbert de dimension 2. Si la solution existe, choisissons 

une base orthonormée (<p+, y 9 -) correspondant aux états propres de S z . On a donc 
S z (ip±) = ±\hip z ±. En écrivant S xy (<p±) dans la base ((p z + , ip z _) et en utilisant les 
relations flV.50[) . on voit facilement que 

= \p% et 4(v4) = ±y<4> ( v - 52 ) 

autrement dit, sous forme matricielle : 

ô _ ( V2 A o _ ( -ih/2 \ * _ (h/2 \ 
bx ~\h/2 ) ' by ~\ih/2 ) ' bz ~\ o -h/2 )^- ù6 > 
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2. Modélisation de l'état spatial d'une particule de spin 1/2 

D'après ce qui précède, pour modéliser l'état spatial d'une particule, nous choisi- 
rons de travailler dans l'espace de Hilbert 

E-H £ externe ® £ spin 

où Eexteme = L 2 (M. 3 ) (l'espace des fonctions à valeurs complexes et de carré somma- 
ble sur M 3 ) et où e sp i n est un espace de Hilbert de dimension 2 possédant une base 
canonique (au signe près) indépendante du temps (</?+, (pi.) correspondant aux états 
propres de S z . Tout vecteur ip de l'espace de Hilbert e H s'écrit alors de manière 
unique comme 

•0 = ip+ ® <p z + + i>- <s> (pi. 

Autrement dit, en fixant une fois pour toutes (</?+,</?!), le vecteur d'état de la 
particule est une fonction d'onde à deux composantes 




En revenant à l'interprétation physique du vecteur d'état, la probabilité de présence 
de la particule sur ficK 3 à l'instant t est 

/ \i)+\ 2 {x,t) + \i)_\ 2 (x ) t)dx. 
Jn 

Les intégrales 

| -?/>-i-| 2 (a;, t)dx 

représentent la probabilité de détecter la particule dans Q et de mesurer que la 
projection de son spin sur l'axe z est ±h/2. 

Remarque V.54. Le spin est complètement indépendant des grandeurs x,y,z. 
Autrement dit, une observable dépendant uniquement de ces grandeurs n'agira que 
sur Eexteme '■ elle sera de la forme A <g> Id £apin et commutera avec toute observable 
ne dépendant que du spin, c'est-à-dire de la forme Id £externe (g) B. 



3. Moment magnétique d'une particule 

Nous allons brièvement parler du moment magnétique d'une particule en mécanique 
quantique pour mettre en évidence le "comportement spinoriel" du spin (voir le 
paragraphe suivant). En physique classique, on définit le moment magnétique créé 
par une distribution de courant j(x) par 

// = - / x A j(x)dx. 

On peut vérifier que cette définition ne dépend pas de l'origine lorsque le système 
est constitué de boucles fermées. Son interprétation physique est simple : si le 

— * 

système est placé dans un champ magnétique B, les boucles de courant vont avoir 
tendance à tourner pour se placer dans une position perpendiculaire à ce champ 
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magnétique. On peut montrer expérimentalement que la force qui s'applique sur la 
boucle de courant est V(/2, B). L'énergie potentielle associée est le produit scalaire 

E =-(//, B). (V.55) 

Si maintenant on considère un électron en orbite autour d'un noyau, nous pouvons 
vérifier que 

p, = l/2qx A v (V.56) 

où v est sa vitesse et où q est sa charge. Par ailleurs, nous avons expliqué dans le 
paragraphe [Q du chapitre [TV] que son moment cinétique était donné par 

L = mx A v. (V.57) 

Autrement dit, les moments magnétique et cinétique sont proportionnels. C'est 
une remarque qui joue un rôle important en physique mais nous ne nous attar- 
derons pas sur le sujet ici. Cependant, en mécanique quantique, nous avons vu 
que le spin a une influence sur le comportement d'une particule qui s'apparente 
au mouvement orbital d'un électron. Nous choississons donc de lui attribuer un 
moment magnétique (x proportionnel à S mais dont l'intérêt est, comme dans le 
cas classique, de tenir compte de la charge de la particule considérée alors que le 
moment cinétique tient compte de sa masse. Nous définissons donc 

/} = 75 (V.58) 

où 7 = 2q/m où q est la charge de la particule considérée et où m est sa masse, ce 
qui peut être comparé avec les formules flV.56j) et (jV.57jl . 



4. "Comportement spinoriel" 

En mécanique classique, une rotation de 2ir agit comme l'identité. Nous allons 
voir que ce n'est pas le cas en mécanique quantique. Pour cela considérons un 
champ magnétique fixe B = B z parallèle à l'axe z. Nous ne nous préoccupons 
pas des variables spatiales et travaillons donc dans e := e sp i n l'espace de Hilbert 
à deux dimensions qui permet de décrire l'état de spin. Notons la base 

canonique associée. La formule ( ]V.55j) nous suggère d'écrire l'hamiltonien lié au 
système comme H — — (//, B ). Il faut donner un sens à cette expression : puisque 
Bq est parallèle à l'axe des z, prendre le produit scalaire avec Bq revient à multiplier 
fi z par le nombre Bq. Puisque fi = jS, on va travailler avec le hamiltonien 

H = -jB S z = u S z (V.59) 

où l'on a noté u = —•yBç,. Les niveaux d'énergie (donc les valeurs propres de 
H) de la particule sont donc ±co h/2 et les vecteurs propres associés sont ip±. 
Supposons qu'à t = 0, le spin de la particule soit dans l'état ^(0) = oap z + + f3ip z _ 
avec | et | 2 + |/3| 2 = 1. Notons tj)(t) = a(t)tp+ + f3(t)ip z _ L'équation de Schrodinger 
dit que ihd t ip = uoS z ip(t), c'est-à-dire 

iK{at{t)<p% + (5'{t) v z _) = u h/2^ z + - y z _) 



4. "COMPORTEMENT SPINORIEL 
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ce qui conduit au système : 

J a '{t) = -iu /2a(t), 
\ 0'(t) = tu /2a(t). 

Avec les conditions initiales a(0) = a et j3(Q) = 0, nous obtenons 

^(i) = «e-^'^V; + /3e^ ot/ V-- (V.60) 

Nous voulons maintenant calculer les moyennes < \i x >, < \i y > et < fi z >. 
En revenant à la définition de la mesure d'une grandeur physique en mécanique 
quant ique, on a 

= jh/2(ae~ lu ' ot/2 f z + + 0e iul ° t/2 f z _, ae~ iulot/2 f z + - 0e luJ ° t/2 f z _), 

c'est-à-dire 

<^ z >= 1 h/2(\a\ 2 -\0\ 2 ). (V.61) 

De même, en utilisant les relations (IV. 52j) . on calcule que 

< /jl x >= C cos(u t + if) (V.62) 

et 

< fi y >= C cos(w t + f) (V.63) 
où l'on a écrit jKâft = Ce ltp . 

On peut tirer deux conclusions des relations flV.6ip . (IV.62|) et (IV.63|) : 

(1) la première est que la moyenne de la composante du moment magnétique 
(et donc du spin) dans l'axe parallèle au champ magnétique ne dépend 
pas du temps alors que sur des axes orthogonaux, cette moyenne est si- 
nusoïdale de période ojq. On appelle ce phénomène la précession de Lar- 
mor. C'est un fait directement observable par l'expérience et qui permet 
ainsi de confirmer le modèle théorique que l'on vient de construire. 

(2) D'après les relations (lV.6ip . (IV.62|) et (IV.63[) . les moyennes des coor- 
données du moment magnétique sont 27r/w -périodiques. En particulier, 
l'influence sur le comportement de la particule du moment magnétique 
est 27r/u;o-périodique. Or, la construction même du spin suggère de l'in- 
terpréter comme une sorte de rotation interne et la 27r/o;o-périodicité cor- 
respond au moment où cette rotation a fait un tour complet. Cependant, 
en revenant à flV.60p . on voit que l'état ip n'est que 47r/o;o-périodique et 
que ip(t + 2n /ojq) = —ip(t). Les lecteurs qui connaissent la construction 
du groupe spin pourront faire le rapprochement avec cette situation. 



CHAPITRE VI 



Principe de Pauli 

Dans ce chapitre, nous allons étudier l'interaction entre plusieurs particules et 
aboutirons encore une fois à des conclusions éloignées de nos habitudes de physique 
classique. 

1. Systèmes de deux particules 

Imaginons un système composé de deux (pour simplifier) particules décrites cha- 
cune dans des espaces de Hilbert E\ et 62- Les principes de la mécanique quantique 
disent que l'on doit étudier le système dans l'espace S\ ®S2- H y a deux remarques 
importantes à faire : chacune sera l'objet d'un paragraphe. 

1.1. Etats d'intrication. Supposons dans ce paragraphe que les Si sont les 
espaces de dimension 2 associés au spin des deux particules, que l'on suppose donc 
de spin 1/2. On a une base canonique dans chaque espace correspondant 

aux états propres de la composante z du spin de chaque particule. Supposons qu'à 
un instant donné l'état du système est 

ip(t) = aipl ®i) 2 _+ pipi (g) ipl- 

Il faut savoir qu'expérimentalement, on est capable de produire ce genre de situa- 
tion. Cet état est très particulier parce que l'on peut faire le raisonnement suivant : 
si on mesure la composante en z du spin de la première particule, on trouvera h/2 
avec probabilité \a\ 2 et — h/2 avec probabilité \(3\ 2 . De même, pour la seconde parti- 
cule, on trouvera h/2 avec probabilité \/3\ 2 et — h/2 avec probabilité \a\ 2 . Là ou cela 
devient étonnant, c'est que la mesure simultanée de h/2 pour chacune des deux 
particules a une probabilité de : plus précisément, on mesurera simultanément 
h/2 pour la première particule et — h/2 pour la seconde avec probabilité \a\ 2 et on 
mesurera — h/2 pour la première particule et h/2 pour la seconde avec probabilité 
\/3\ 2 . Les deux particules ne sont plus dissociées : on dit que le système est dans 
un état intriqué. On peut donner une définition mathématique plus précise : 

DÉFINITION VI. 64. On dit que le système constitué des deux particules est dans 
un état intriqué si le vecteur d'état ne peut pas se mettre sous la forme ip(t) = 
i) l {t)®i) 2 {t). 

Dans ces situations, les particules dépendent l'une de l'autre. Einstein, Podolsky 
et Rosen se basèrent sur ces états pour formuler un paradoxe connu sous le nom 
de paradoxe EPR permettant d'infirmer les principes de la mécanique quantique. 
Pour décrire très brièvement leur argument, ils disaient qu'en mesurant le spin 
de la première particule mais sans toucher à la deuxième et en communiquant 
ensuite le résultat trouvé, par exemple h/2, on était certain de mesurer — h/2 

45 



46 



VI. PRINCIPE DE PAULI 



pour la deuxième, contredisant en apparence le fait qu'on avait une probabilité 
\a\ 2 de trouver —h/2. On aboutit à des prédictions différentes en considérant deux 
systèmes d'une seule particule ou au contraire un seul système de deux particules. 
L'erreur dans leur raisonnement consiste à dire qu'en faisant une mesure sur la 
première particule, on ne change rien à l'état de la seconde. Les états intriqués 
sont justement des états où l'on ne peut plus dissocier les deux particules et leur 
attribuer à chacun un état bien distinct. Le paradoxe EPR sera d'ailleurs contredit 
par l'expérience. 

1.2. Indiscernabilité des particules. Un autre problème se pose : celui de 
savoir comment discerner deux particules. La plupart du temps, ce sont les critères 
physiques qui permettent de le faire. Mais si maintenant les particules sont de 
même nature, deux électrons par exemple? La situation est différente de celles 
que l'on rencontre au quotidien : deux objets identiques ont toujours de petites 
différences qui permettent de les différencier. Au niveau des particules, il en va au- 
trement : deux électrons sont identiques en tout point. Il reste alors une solution : 
celle d'attribuer un numéro à chacune des particules et de suivre leur trajectoire. 
Mais là encore, c'est une méthode qui ne marche qu'au niveau macroscopique, les 
trajectoires des particules étant mal définies. 

Ce problème se lit dans les principes de la mécanique quantique. En effet, prenons 
une situation physique quelconque où deux particules identiques sont soumises aux 
mêmes conditions physiques. Les espaces e± et e 2 sont alors égaux, de même que 
les hamiltoniens H\ et H 2 . Notons s :— E\ — e 2 et H :— H\ — H 2 . Le hamiltonien 
du système formé par les deux particules, dont l'espace de Hilbert associé est e (g) e 
doit être exactement 

H tot = H®Id £ + Id £l <g> H 2 . 

En effet, les valeurs propres de H tot doivent être exactement les sommes des va- 
leurs propres de H puisque l'énergie totale du système est égale à la somme de 
l'énergie portée par chaque particule. Considérons donc deux niveaux d'énergie 
Ei et E 2 distincts de H et notons ip\ et ip 2 les vecteurs propres correspondants. 
On remarque que la valeur propre E\ + E 2 de H tot possède un espace propre de 
dimension au moins 2 contenant ipi ® 1P2 et ip 2 <S> ipi- La question est maintenant : 
supposons que l'on fasse une mesure de l'énergie du système à l'instant t et que 
l'on trouve E 1 + E 2 . Les principes de mécanique quantique disent qu'en t, le vec- 
teur d'état ip doit être un vecteur propre normalisé de l'espace propre associé à 
Ei + E 2 . Le problème est maintenant qu'il n'y a aucune raison de priviligier un 
choix de vecteur propre plutôt qu'un autre dans cet espace propre. On pourrait 
par exemple se dire qu'on a numéroté les particules et que l'on postule de prendre 
ijj — ipi (g) ip 2 à l'instant t. Cette manière de procéder ne tient pas puisque si on 
avait juste choisi d'inverser les numéros 1 et 2 au début de l'expérience (ce choix 
n'influe en rien sur le sytème), on aboutit à une situation différente à l'instant t 
alors qu'on a fait exactement la même manipulation du système, celle de mesurer 
son énergie. On pourrait imaginer que ces considérations n'ont aucune influence 
physique : c'est-à-dire que dans les deux cas, on arrive à des vecteurs d'état certes 
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différents mais dont les différences ne se lisent pas dans leurs effets physiques. Mal- 
heureusement, l'expérience prouve que ce n'est pas le cas. 

Pour résoudre cette ambiguïté, il convient de formuler un nouveau principe appelé 
principe de Pauli et décrit dans le paragraphe [3] 

2. Spin d'un système de deux particules 

Avant de parler du principe de Pauli, il convient d'expliquer comment modéliser le 
spin de deux particules. D'abord, en mécanique classique, le moment cinétique total 
de deux systèmes est égal à la somme des moments cinétiques des deux systèmes. 
On va garder cette même règle pour le spin. Autrement dit, soient deux particules 
que nous allons supposer de spin 1/2 dont le spin est décrit dans les espaces e l spin 
et s 2 spin . On va décrire le spin du système dans l'espace e s = e], pin ®s 2 spin qui est de 
dimension 4. Si l'on note S 1 (i = 1, 2) les observables vectorielles de spin associées, 
l'observable totale S sera 

S = S 1 ® Id F i + Id F 2 <g> S 2 . 



^ sptn 



La raison est la même que dans le paragraphe précédent à propos de l'énergie : cela 
permet que les valeurs propres de S, c'est-à-dire les valeurs mesurables possibles, 
soient les sommes des valeurs mesurables pour chacun des deux spins. Par abus de 
notation, nous écrirons 

S = S 1 + S 2 . 

Notons (cr + , <r|) la base canonique de e l spin , donc états propres de la composante 

en z de S 1 . Notons enfin <r±,± := <J± <8> cr±- Les <J± t ± forment une base de e s . De 
même que pour le cas d'une particule, nous allons poser 

s = (S x ) 2 + (S y ) 2 + (S z ) 2 = (Si + S 2 X ) 2 + (Si + S 2 ) 2 + (Si + S 2 Z ) 2 (VI.65) 

dont nous notons S (S + l)h 2 les valeurs propres. De même, nous paramétrons 
les valeurs propres de S z par MH. Nous noterons as,M le vecteur propre commun 
associé. Commençons par regarder les valeurs que peut prendre la norme de S 
et donc les valeurs propres de s. Puisque les composantes de S 1 ne prennent que 
les valeurs ±h/2, les composantes de S ne prennent que les valeurs ou Par 
conséquent, on peut se dire qu'a priori, \\S\\ 2 prendra les valeurs 0, h 2 , 2h 2 ou 3h 2 . 
En fait, ce n'est pas le cas. En effet, on calcule directement en utilisant les relations 
( jV32D que 

s((j +j+ ) = 2h 2 a +t+ , s((T__) = 2h a--, 
_L( a+ _ + a _ >+ ) j = 2 ^-L( (T+i _ + o-_,+) et s " = °- 

Autrement dit, s ne possède que 2 valeurs propres : 

- 2h 2 correspondant à la valeur S = 1 dont l'espace propre est de dimension 3 
engendré par les vecteurs Oi := cr +i+ , ©2 := et O3 := ~^( (J +- + °"-,+) 

- correspondant à la valeur S = dont l'espace propre est de dimension 1 
engendré par 4 := 775(0+,- — o_ j+ ). 
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Les états de l'espace propre correspondant à S — 1 sont appelés états triplets et 
celui correspondant à S = est appelé singulet. Nous conservons les notations du 
paragraphe précédent mais nous supposons cette fois que les particules sont les 
mêmes. On a donc e] pin = e 2 spin et on peut définir Y opérateur d'échange (pour le 
spin) P s par 

£ s ^ & s 

u®v i-» v <S> u. 

Les vecteurs de e s ne s'écrivent pas tous sous la forme u £g> v mais on étend la 
définition par linéarité à e s tout entier. Alors, par définition des vecteurs 6j, on 
voit que : 

P,(e i ) = e i e i (VI.66) 

avec Si = 1 si i = 1,2,3 et £4 = —1. Autrement dit, les vecteurs propres corres- 
pondant à S — 1 sont "totalement symétriques" tandis que ceux correspondant 
à S — sont "totalement anti-symétrique" Cette relation va jouer un rôle fonda- 
mental dans le paragraphe suivant. 



3. Principe de Pauli 

Nous avons dit qu'il fallait nécessairement que deux particules de même nature 
soient indiscernables. Supposons que le système composé par ces deux particules 
soient associé à l'espace de Hilbert Eu = £®£, l'espace de Hilbert e étant lui-même 
associé à chacune des deux particules. Définissons l'opérateur d'échange entre les 
deux particules de la même manière que ci-dessus, c'est-à-dire par 



u®v 1 — y v ® u. 

Le principe que l'on veut formuler consiste donc à dire que, si if) est le vecteur d'état 
du système, P(i/j) représente le même état physique que ip. Remarquons que deux 
vecteurs d'état ip et ip' décrivent la même situation physique si et seulement si 
toutes les mesures que l'on peut faire sur le système donnent les mêmes résultats, 
autrement dit si pour tout opérateur A, on a 

(vav) = (v>',V)- 

Il est facile de voir que cette condition est réalisée si et seulement si ip s'écrit 
ip' = e ltp ip. En appliquant cette observation à notre situation, on a donc P(ip) = 
e tip ip et puisque par ailleurs P 2 = Id, e lip = ±1. Cela signifie donc que l'on doit 
poser comme principe que tout vecteur d'état d'un système de deux particules est 
soit totalement symétrique soit totalement antisymétriques. Reste à savoir quel 
est le bon choix à faire. D'ailleurs, ce bon choix, s'il existe, ne dépend-il que de la 
nature des particules? Autrement dit, un système de deux particules identiques 
doit-il toujours avoir un vecteur d'état symétrique, anti-symétrique ou bien les 
deux situations peuvent-elles arriver? Le principe de Pauli postule la réponse à 
ces questions et modifie la définition des bosons et fermions donnée plus tôt. 

Principe de Pauli : Toutes les particules de la nature appartiennent à l'une des 
catégories suivantes : 
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- les bosons pour lesquels le vecteur d'état de deux particules identiques est symétri- 
que (i.e. Pip = ip) ; 

- les fermions pour lesquels le vecteur d'état de deux particules identiques est anti- 
symétrique (i.e. Pip = —ip). 

Toutes les particules de spin entier ou nul sont des bosons tandis que celles de spin 
demi-entier sont des fermions. 

Il faut bien comprendre que ce principe est un postulat : rien ne nous a permis 
de décider qu'une particule de spin 1/2 par exemple était dans un état totalement 
anti-symétrique plutôt que symétrique. Cela deviendra un théorème en mécanique 
quantique relativiste (dont nous ne parlerons pas dans le chapitre correspondant) 
et par ailleurs, l'expérience confirme que ce postulat est correct. 

Ce principe réduit l'espace dans lequel on travaille. Par exemple, considérons deux 
particules de spin 1/2 et regardons seulement leur spin. D'après ce principe, il doit 
être dans l'état singulet décrit dans le paragraphe précédent. Le vecteur d'état de 
spin doit donc être égal à ^(<t +i _ — <T -,+)- Ce qui signifie que, quelle que soit la 
mesure effectuée sur le spin, on trouve les particules dans un état opposé. C'est 
pourquoi on parle du principe d'exclusion de Pauli. Il faut savoir que ce principe a 
un grand nombre de conséquences macroscopiques dont nous ne parlerons pas ici. 

Remarque VI. 67. On prendra garde de ne pas confondre le fait d'être dans un 
état anti-symétrique et le principe d'exclusion évoqué ci-dessus. En effet, il existe 
des états symétriques qui ont la même conséquence : par exemple l'état triplet 
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CHAPITRE VII 



Mécanique quantique relativiste 

De par sa construction qui considère le temps comme découplé des variables d'es- 
pace, la mécanique quantique n'est pas compatible avec les principes de relati- 
vité restreinte. On peut d'ailleurs vérifier que la théorie n'est pas invariante par le 
groupe de Lorentz ce qui signifie que deux observateurs relativistes ne sont pas phy- 
siquement équivalents. Expérimentalement, on observe aussi que, comme on pou- 
vait s'en douter, la mécanique quantique n'est précise que lorsque les phénomènes 
observés ne mettent en jeu que des particules à faible vitesse. Elle n'est par exemple 
pas un bon modèle pour décrire toutes les expériences où il y a interaction entre 
lumière et matière. 

Nous présentons dans ce chapitre les premières tentatives pour modifier la mécanique 
quantique afin la rendre relativiste. C'est ainsi que nous aboutirons à l'équation 
de Dirac. C'est cependant une vision très incomplète et qui dans de nombreuses 
situations où elle ne s'applique pas, a été abandonnée au profit de la théorie 
quantique des champs, incomplète elle-aussi mais permettant de réparer certaines 
incohérences évidentes de la mécanique quantique relativiste. Pour comprendre 
comment on en est arrivés à la théorie quantique des champs, il est nécessaire de 
comprendre cette théorie. 

1. Equation de Klein-Gordon 

Nous allons d'abord chercher à trouver une équation relativiste en ne nous préo- 
ccupant que des variables d'espaces. En d'autres termes, nous commençons à tra- 
vailler avec une particule de spin 0. Dans ce cadre, pour bâtir une théorie relativiste, 
il est naturel de travailler dans l'espace de la relativité restreinte, autrement dit, 
M. 4 muni de la forme quadratique rj := dx 2 — dt 2 de signature (3, 1). Rappelons que 
dans ces coordonnées, la vitesse de la lumière vaut 1. Nous n'allons pas chercher 
dans ce paragraphe à pousser la théorie au maximum. Nous nous contenterons de 
soulever quelques problèmes posés par la mécanique quantique relativiste. Nous 
serons plus précis dans le paragraphe suivant. Pour commencer, il faut essayer de 
dégager le coeur de la mécanique quantique : il s'agit évidemment de l'équation 
de Schrôdinger ihd t ip = Hip. En effet, tous les autres principes ne font que définir 
le cadre de travail et donnent le moyen de relier la théorie à la situation phy- 
sique. Par contre, c'est cette équation qui décrit l'évolution du système. Nous 
allons donc commencer par supposer que la particule est décrite là aussi par une 
fonction d'onde définie sur M 4 et essayer de trouver une "équation de Schrôdinger 
relativiste ". Plaçons- nous dans la situation la plus simple où la particule n'est pas 
chargée, et évolue dans le vide sans contrainte. En mécanique classique et dans ce 
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contexte, l'énergie du système est composé uniquement de son énergie cinétique 
E = l/2m\\v\\ 2 = \\p\\ 2 /2m où v et p sont les vecteurs vitesse et quantité de mou- 
vement. Cette expression nous a conduits à définir l'observable énergie totale H 
par (voir (jïLSCl ) 



H = Ê C + Ê P = -—A. 

2m 

Dans le même situation physique, que nous regardons cette fois d'un oeil relativiste, 
le calcul de l'énergie totale tiendra compte de l'énergie au repos de la particule 
donnée par la célèbre E = me 2 . Nous ne rappellerons pas ici les bases de la 
relativité restreinte et donnons directement la valeur de l'énergie en fonction du 
vecteur quantité de mouvement p (qui appartient à l'espace vu par l'observateur) 
et de la masse au repos : on a 

E = y/rj(p,p) - m 2 . (VII.68) 

En procédant de la même manière que pour obtenir (III. 30p . cela conduit à poser 

H = V-h 2 A + m 2 . 

Cette définition n'a pas de sens : pour lui en donner un, plutôt que sur (1VII.68j) . 
il faut se baser sur l'expression 

E 2 = r](p,p) - m 2 (VII.69) 

et de ce fait, poser comme équation de Schrôdinger relativiste 

(ihd t ) 2 ïp(x,t) = -h 2 Aip(x,t)+m 2 ïp(x,t) 

c'est-à-dire, 

Dip + [—) ip = (VII.70) 

où □ := — d 2 +A est l'opérateur d'Alembertien. Cette équation est appelée équation 
de Klein- Gordon. On peut vérifier qu'elle est invariante par le groupe de Lorentz 
et dans un premier temps en tout cas, elle est un bon candidat pour être une 
équation de Schrôdinger relativiste bien que nous n'ayons pas expliqué encore les 
principes de la théorie. 



2. Limites de l'équation de Klein-Gordon 

L'équation de Klein-Gordon est insatisfaisante à plusieurs égards : 

(1) D'abord, les relations (IVII.68P et (IVH.69P ne sont pas équivalentes. En 
effet, ( 1VII.69j) est équivalente à 



E = ±a/ Tj(p,p) — m 2 . 

Autrement dit, d'un point de vue mathématique, cela conduit à des énergies 
qui peuvent être négatives. Nous étudierons plus tard ce qu'il en est au 
niveau physique. 
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(2) Supposons qu'un observateur connaisse l'état d'un système à l'instant 
t — 0, c'est-à-dire qu'il connaisse ip à l'instant t = 0, il ne peut pas en 
déduire l'évolution du système : en effet, l'équation de Klein-Gordon étant 
d'ordre 2 par rapport au temps, il lui faut en plus connaître d t ip en t = 0. 
En particulier, il en sera de même pour des vitesses faibles. Cela contredit 
la mécanique quantique non relativiste pour laquelle la connaissance de 
l'état du système à un instant donné est suffisante pour connaître son 
évolution. 

Avant de regarder les conséquences physiques d'énergies négatives, il faut d'abord 
mettre au point la théorie. Nous nous intéressons donc au point (2). Faisons ce 
qui est habituel quand on regarde une EDO d'ordre 2 que l'on voudrait ramener 
à l'ordre 1 (en t seulement) : on définit le vecteur 

i> 



On est ramenés à l'équation d'ordre 1 suivante : 

_ / Id\ 

En fait, il sera plus commode de poser 

(p x = $ + —dtil) et <p 2 = if) - —dt1> (VII. 71) 

m m 

et de remarquer que la fonction d'onde définie par $ = (<pi,<p2) vérifie l'équation 
suivante 

1 / ih a iti A I 2im \ 

d ^ = ïï _*Â - Sa m -î A h (VIL72) 

\ m h m J 

Si la vitesse de la particule est petite devant la vitesse de la lumière, nous pouvons 
négliger son énergie cinétique devant son énergie interne et donc l'énergie totale 
est égale à E ~ me 2 = m 2 . En raisonnant de la même manière que pour obtenir 
(III. 30p et (1VII.69j) . cette égalité se traduit en terme d'observables par ihd t ip = mip 
et donc pour des situations non-relativistes, <^2 ~ 0. En prenant <^2 = et en 
regardant la première coordonnée dans (lVII.72p . on obtient 

dtVi = 77— 
2m 

Autrement dit, on retrouve l'équation de Schrodinger non-relativiste. 



Il convient maintenant de faire une remarque importante : dans le cadre non- 
relativiste, l'interprétation de la fonction d'ondes comme une densité de probabi- 
lité dépend de manière évidente de la forme produit (espace * temps) de l'espace- 
temps. En effet, il suffit d'imposer que sur les espaces t = constante, la fonction 
d'onde soit de norme 1. Le premier problème que nous rencontrons ici est qu'en 
relativité restreinte, le temps n'est pas universel et poser t = constante avec la 
coordonnée t de M 4 revient à choisir un observateur particulier. C'est en fait un 
faux problème : en effet, l'idée sera de construire une densité de probabilité P(x, t) 
telle que L 3 P(x, 0)dx = 1 Ensuite, en se débrouillant bien (voir ci-dessous), on 
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montre que l'équation de Klein-Gordon implique J R3 P(x,T) 2 dx = 1 pour tout 
T. L'équation de Klein-Gordon étant invariante par le groupe de Lorentz, cette 
conservation de norme sera vraie quel que soit la variable de temps t choisie, pour 
peu qu'elle corresponde à un observateur galiléen. 



Venons-en au deuxième problème : on veut obtenir la conservation de norme 
évoquée ci-dessus. Notons (■, ■) le produit scalaire de L 2 . En mécanique quantique 
non-relativiste, on posait P(x,t) = \ip\ 2 et l'équation de Schrodinger impliquait 
que 

d t / P(t,x)dx = / (d t ip)^ + ij(d t ^)dx = 0. 

JR3 J R 3 

Si maintenant nous considérons une solution de ip de l'équation de Klein-Gordon 
flVII.70p . et si nous posons P(x,t) = \ip\ 2 , le même raisonnement ne fonctionne 
plus. Il ne fonctionne que lorsque la fonction d'onde est soumise à une équation 
du type d t ip = Aip où A est auto-adjoint. L'équation de Klein-Gordon n'est pas 
sous cette forme et il faut s'y prendre autrement. La première possibilité consiste 
à poser : 

P(x,t) = -(^)^ + ^(^) (VII.73) 
m 

où la constante — , qui n'a aucune importance dans le raisonnement, a été choisie 
pour retrouver la situation non-relativiste en approximation. Avec cette expression 
et l'équation de Klein-Gordon, on obtient 

d t / P(t,x)dx= / (d t tip)i(jip(d t tilj)dx 
Jm. 3 Jm 3 

f TTl 2 TTl 2 

= / (AV> + -z^ - (AV> + -T7T ip)ipdx =0 

où la dernière égalité s'obtient en intégrant par partie. La formule (1VII.73|) pose de 
toute manière un problème important : on peut vérifier que la densité de proba- 
bilité P(x,t) définie sous cette forme n'est pas positive partout. D'après Pauli et 
Weisskopf |P W34] . cela peut néanmoins se résoudre en modifiant l'interprétation 
de P(x,t) mais leur théorie soulève de nombreux problèmes. 



La deuxième possibilité est de travailler en définissant P(x,t) = ||$|| 2 où $ est 
solution du système (IVII.71j) . Nous ne rentrerons pas dans les détails dans ce pa- 
ragraphe. L'équation de Dirac que nous étudierons dans le prochain paragraphe se 
base sur le même principe : travailler avec une équation d'ordre 1. Cela permet de 
définir la densité de probabilité comme la norme de la fonction d'onde. 



Au final, quoi que l'on fasse, deux problèmes vont subsister : 

(1) l'existence de solutions d'énergie négative : c'est ce qui conduira Dirac à 
postuler l'existence d'un "positron", particule analogue à l'électron mais 
chargée positivement (voir prochain paragraphe) ; 
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(2) le problème de conservation du nombre de particules que nous n'avons pas 
encore évoqué mais qui est pourtant le plus fondamental : expérimentale- 
ment, on sait que le nombre de particules d'un système n'est pas une 
quantité conservée. Or par construction même de la mécanique quan- 
tique où l'on construit l'espace de travail en fonction des degrés de liberté 
de chaque particule, la théorie n'est pas adaptée à la situation. C'est ce 
point particulier qui fera que la mécanique quantique relativiste est aban- 
donnée dans de nombreuses situations au profit de la théorie quantique 
des champs. 

3. L'équation de Dirac 

Nous allons maintenant essayer de construire une théorie relativiste des particules 
de spin 1/2, disons de l'électron pour fixer les choses, c'est-à-dire qui tient compte 
du spin. Nous nous placerons dans une situation sans champ électromagnétique. De 
ce fait, nous ne verrons pas les effets de la charge de la particule et n'en tiendrons 
donc pas compte. Les deux problèmes évoqués à la fin du paragraphe précédent 
ne seront pas résolus ici : comme nous l'avons dit, seule la théorie quantique des 
champs sera à même de lever le problème de non-conservation du nombre de par- 
ticules. Nous allons travailler dans un espace de Hilbert e extérieur spin- D'après le 
modèle non-relativiste, il est naturel de considérer que e spin est de dimension finie. 
La composante de spin étant vectorielle, elle comportera en relativité restreinte 
quatre composantes, c'est-à-dire quatre observables là où il n'y en avait que trois 
dans la théorie non-relativiste. C'est l'étude de ces quatre observables qui fixera 
la dimension de e s mais cette discussion est repoussée à plus tard. En tout cas, à 
ce point, en fixant une base (ip±, • • • , f r ) de l'espace e sp i n , on pourra considérer le 
vecteur d'état ip — (V'i) ' ' ' >Vv) comme un vecteur à r composantes, où r est la 
dimension de e spin et où chaque composante est une fonction d'onde de l'espace 
£ '■= e extérieur = £ 2 (IR 3 ). Le vecteur ip G e extérieur <S> s spin original se retrouvera en 
écrivant ip = YH=i ^i^fi- Dans la suite, nous jonglerons avec ces deux manières de 
voir les choses. Pour obtenir un modèle satisfaisant, il faudra que le vecteur d'état 
ip soit soumis à une équation généralisant celles de Schrôdinger (qui ne tient pas 
compte des phénomènes relativistes) et de Klein-Gordon (qui ne tient pas compte 
du spin) et qui devra avoir deux propriétés principales : 

(1) elle devra être invariante sous l'action du groupe de Lorentz; 

(2) elle devra être d'ordre 1 en t et plus précisément de la forme 

ihdti) = H D %1) (VII.74) 

où Un est un opérateur auto-adjoint. En définissant la densité de proba- 
bilité de présence par P(x,t) = X^=i ll'^il| 2 ( a; ^)' 1 & forme de l'équation 
montrera que d t f R3 P(x, t)dx = 0. La démonstration est la même que celle 
du cadre non-relativiste. 

La forme explicite de H D dépendra bien évidemment du système physique étudié. 
Comme toujours, ce sont les situations les plus simples qui servent de guide pour 
construire des modèles de systèmes plus élaborés. C'est pourquoi ici, nous allons 
nous placer dans un système physique composé d'un seul électron qui n'est soumis 
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à aucun potentiel, qui pourrait d'ailleurs briser l'invariance sous l'action du groupe 
de Lorentz. Il sera plus commode d'utiliser les notations (x% := x,x 2 := y, £3 : = 
z, X4 := t) pour simplifier les expressions. L'observable Hjj représentera, comme 
dans le cas non-relativiste, l'énergie totale du système. Il y a plusieurs remarques 
à faire : en ce qui concerne la partie "spatiale", l'énergie du système dépendra 
évidemment de la quantité de mouvement p = (pi,P2,P3) (on se place du point de 
vue d'un observateur galiléen qui "voit" les espaces t = constante) mais pas de 
la position (xi,x 2 ,x 3 ) puisque l'équation doit être invariante par les translations. 
Autrement dit, dépendra des observables pj = —ihdj mais pas des Xj. De plus, 
le groupe de Lorentz, contrairement au groupe 0(3) agit aussi sur la quatrième 
composante. Dans l'équation (1VII.74[) . le terme qui contient l'opérateur d t est 
linéaire. Il doit en être de même pour les termes contenant les opérateurs dj, et 
donc les opérateurs pj. On remarque enfin que l'énergie au repos est une fonction 
linéaire de la masse et c'est pourquoi nous supposerons que le terme contenant m 
doit aussi être linéaire. Pour finir, on va faire l'hypothèse raisonnable que Hjj se 
met sous la forme 



Hn = H, 



extérieur 



H 



sptn 



où les observables H exterieur et H spin agissent respectivement sur e exter ieur et e spin . 
Les remarques que nous avons faites ci-dessus conduisent à faire l'hypothèse que 
H D est de la forme 



Ho = àjp + m<7 4 



(VII. 75) 



où l'opérateur m associé à l'énergie au repos est confondu avec m (la multiplication 
par m) et où l'observable vectorielle 



a 



0"! 

ô"3 

V<7 4 . / 



agit uniquement sur e spin . Les arguments ci-dessus n'ont aucune rigueur mais 
comme toujours en physique, on propose des modèles et l'expérience viendra confir- 
mer leur efficacité : c'est ce que se passe ici. 



Remarquons tout de même que cela suppose l'existence d'une observable vectorielle 
de dimension 4 agissant sur l'espace e sp i n , ce qui n'est pas totalement déraisonnable 
sachant que nous travaillons cette fois sur M 4 . Il est naturel de supposer par ailleurs 
que l'équation de Klein-Gordon est vérifiée lorsqu'on ne considère que les parties 
spatiales de Hp- C'est-à-dire que l'on veut que 

-h 2 d tt ^= (EA 2 + S V (VII.76) 



4. ÉCRITURE SPINORIELLE DE L'ÉQUATION DE DIRAC 

Des relations (1VH.74j) et ( 1VII.75j) . on tire que 
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ihd t ip — àjp — ma^ 1^ = 0. 
i=i / 
Et donc 

3 \ / 3 \ 

ihd t ip + âjp + mhoi J | ihd t ip — âjft + raha^ 1-0 = 0, 

j=l ) \ j=l J 

c'est-à-dire, puisque les observables de spin commutent avec les observables ex- 
ternes : 



h 2 d tt ip - 22 tfpj ~ m2 ôl ~ ^2 + °iàj)PjPi 



3=1 



l<j<l<3 



— ^^(âjô"4 + â^âj)mâ4 ip — 0. 

3=1 

En comparant cette expression avec flVII.76p . nous obtenons que, pour tous j, l G 
{l,---4},j^, 



1 et àjà\ + âiâj = 0. 



~3 - ^J^l 1 w l w 3 

L'équation (jVII.74p . qui se réécrit sous la forme 

3 

— ihd t ip = (Vj âjp + ma^jip 

3=1 

où les âj vérifient fl VIL 771) . est appelée équation de Dirac. 



(VII.77) 



(VII.78) 



4. Écriture spinorielle de l'équation de Dirac 

L'adjectif "spinorielle" qui apparaît dans le titre de ce paragraphe ne signifie 
pas "relatif au spin" puisque de toutes manières, l'équation de Dirac est là pour 
modéliser le spin de l'électron. Il signifie que l'on va exprimer l'équation de Di- 
rac avec l'objet mathématique "spineur" que nous décrivons très rapidement dans 
l'appendice O Reprenons les notations du paragraphe précédent et posons pour 

ie {1,2,3}, 

7i := â 4 âi et % := â 4 . 
D'après les relations flVIL77j) . on voit que 

-1 si % e {1,2, 3} 
1 si % = 4 



7< 



et que, si i ^ j 

îâj + îj% = o. 

On reconnaît ici les relations (1III.97P de l'appendice O vérifiées par les opérateurs 
p(ej) agissant sur £ 4 . Puisque £ 4 est de dimension minimale parmi les espaces 
sur lesquels des opérateurs vérifiant de telles relations agissent, on peut raison- 
nablement poser E sp in := S 4 (rappelons que le spin 1/2 correspond à la valeur 
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minimale de spin non nulle et donc à l'espace e sp i n de plus petite dimension) et 
poser 7j := p(ej) = er où l'on a muni M 4 de la base canonique et où e 4 correspond 
à la coordonnée t. On travaille donc maintenant sur l'espace e := L 2 (IR 4 ) ® £4. Un 
vecteur d'état s'écrit 

4 

où l'on a choisi une base orthonormée (#1, • • • ,$4) de £4 et où les ipj son t des 
fonctions de carré intégrable et à valeurs complexes. Pour tous (x,t) G M 4 et j, 
i/)j(x, t) G C et donc 

4 4 

3=1 3=1 

ce qui fait que ^ peut se voir comme une fonction de M 4 à valeurs dans £4. Avec 
ces notations, en multipliant à gauche par cr 4 , l'équation de Dirac se réécrit 

4 

ih 6j ■ djip — rnip = 
c'est-à-dire avec les notations de l'appendice ICI 



(ihD(ip)-m)'ip = 0. (VII.79) 

L'équation mise sous cette forme est sans doute plus difficile à interpréter d'un 
point de vue physique mais à l'avantage de faire intervenir des objets bien connus 
des mathématiciens. En particulier, l'opérateur D se définit parfaitement de manière 
intrinsèque sur les variétés lorentzienne. L'espace (1R 4 , 77) étant une variété lorent- 
zienne, l'équation de Dirac ne dépend pas des coordonnées choisies et est donc 
invariante par le groupe de Lorentz. 

5. Une construction plus physique de l'espace e sp i n 

L'écriture spinorielle du paragraphe précédent a l'avantage de donner une forme 
simple à l'équation de Dirac mais se prête mal à son interprétation physique. 
Nous allons essayer de présenter la situation sous un angle différent. A la place de 
construire les opérateurs %, nous aurions pu poser 

â\ := — iâ 2 â 3 , â 2 := — iâ 3 âi,â 3 := —i&i&2 

et aussi 

A := -ÎÔ102Ô3, fil ■= -i<74<7i0- 2 0-3 et Â := 04. 
De nouveau avec les relations fl VII. 771) . on voit que 

- les opérateurs âj commutent avec les opérateurs (3j : on a donc envie de cher- 
cher e spin sous la forme e spin = s\ pin ® s 2 spin où les opérateurs âj et (3j agissent 
respectivement sur e\ pin et e 2 spin . 

- Les opérateurs vectoriels (âi, â 2 , â 3 ) et 0i, (3 2 , $3) satisfont aux mêmes relations 
de commutation qu'un spin, c'est-à-dire qu'elles satisfont aux relations (IV. 50}) . 



5. UNE CONSTRUCTION PLUS PHYSIQUE DE L'ESPACE e spi . 
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Le raisonnement mené dans le cadre non-relativiste s'applique alors sur chaque 
£ l P in- O n va donc décider de prendre e l spin = e 2 spin = e s où e s est l'espace de 
Hilbert à deux dimensions avec lequel on a déjà travaillé pour définir le spin 1/2 
en mécanique quantique non-relativiste. Par ailleurs, les définitions des âj ne font 
intervenir que les coordonnées spatiales âj avec j G {1, 2, 3}. On va lui faire jouer 
un rôle particulier ce qui permettra de retrouver l'interprétation non-relativiste du 
spin. Pour cela, il suffit de voir que o± = $3 qui agit sur e 2 spin = £2 vérifie /3| = 1 et 
donc e 2 spin = Vect(ti + , w_) où (u + ,U-) est une base orthonormée de e 2 spin composée 
des vecteurs propres u± associés aux valeurs propres ±1 de $3. On peut donc écrire 

où. e± := e s <8> Vect(zt±). On peut donc aussi écrire 

£ (ê extérieur ® £+) ~t~ ^extérieur ® £— )■ 

Via cette décomposition, le vecteur d'état ?/> se décompose en la somme 

V> = i>+ + i>- 

où if)± s'écrivent ip± ® u± et sont donc des vecteurs propres associés à la valeur 
propre ±1 de l'observable â 4 . Puisque chacun des deux espaces £ ex terieur ® £± 
est de dimension 2, on peut convenir que les deux premières coordonnées de ip 
correspondent à ip + et les deux dernières à ip- et rééecrire la notation initiale 
ip = (ipi, ip2, "03 j ^4) de la manière suivante 



0H 
0- 



ou 



^ + = ( t 1 ) et V- " ^ 3 



1p2 J V 



Venons-en maintenant à l'interprétation physique de Nous discuterons rapi- 
dement de celle de ip- dans le paragraphe suivant mais elle est beaucoup moins 
claire et les physiciens ne s'accordent pas sur ce point. 



Reprenons l'équation de Dirac (1VII.78I) 

3 

—ihd t ip = (/; âjpj + â^m) 
i=i 

et plaçons-nous à un niveau d'énergie E. Autrement dit, considérons un vecteur 
propre tp vérifiant 

3 

E + à 4 m )<P = E ^ (VII.80) 
i=i 

que nous décomposons en ip = ip + + ip_ ~ (ip + , (pj) associé à la décomposition de e. 
Par construction, â^<p± = ±<p±. Par ailleurs, plaçons-nous dans des conditions non- 
relativistes : la quantité de mouvement est petite par rapport à la masse et donc 
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E ~ m. En reportant dans (1VII.80j) où l'on néglige les termes faisant apparaîitre 



la quantité de mouvement, on obtient 

â 4 m(^+, <p_) ~ m((p + , </?_), 

c'est-à-dire 

ce qui implique qu'à la limite non-relativiste ~ 0. C'est la raison pour laquelle 
on considère que le vecteur if) + s'interprète comme le vecteur d'état non-relativiste 
de la particule et contient tout l'information sur le spin. Plus précisément, le spin 
vectoriel de la particule est donné par l'observable vectorielle (âi, «2, âs). 



6. De la théorie du positron à la théorie quantique des champs 

Dans ce paragraphe, nous allons nous intéresser de plus près au problème des 
énergies négatives dont nous avons déjà parlé plus haut. Pour commencer, plaçons- 
nous dans la même situation qu'à la fin du paragraphe précédent et considérons 
une situation non-relativiste. Nous avons vu alors qu'un état d'énergie était décrit 
par un vecteur propre (■?/>+,?/>_) où la composantes ip- est très petite devant la 
composante ip + (on parle d'ailleurs de grandes et petites composantes). Rappelons 
que, avec les notations du paragraphe précédent, les vecteurs ip± s'écrivent if)± = 
ip±®u±. Considérons maintenant le vecteur ?p := (■?/>_ £g> u + , ip + <8> uJ). D'après ce 
qui précède, la composante ip-®u + est petite par rapport à tp + ç§U-. En négligeant 
encore une fois la quantité de mouvement, ce vecteur est cette fois propre pour 
l'énergie Hp ~ mâ^ mais avec valeur propre —m. Si l'on ne néglige plus les termes 
de quantité de mouvement, ip n'est pas nécessairement un vecteur propre mais on 
obtient malgré tout que 

$,H D $)<U. 

Cela suggère deux remarques : 

- D'abord, il existe des états d'énergie négative. Nous l'avons déjà évoqué mais 
nous en obtenons ici une preuve. On peut en fait être beaucoup plus précis et 
décrire précisément les états d'énergie négative, ce qui ne nous sera pas utile ici. 

- La vecteur d'état à deux composantes ip- semble correspondre à une particule 
qui se comporte comme l'électron mais dont la masse est négative. 

La théorie permet de prédire assez précisément le comportement que pourrait 
avoir une particule de masse négative. Mais ce comportement n'a jamais été ob- 
servé expérimentalement. Par contre, des phénomènes similaires au niveau de la 
charge ont été observés. Pour simplifier les choses, nous avons ignoré la charge mais 
avec des raisonnements similaires, nous pouvions mettre en évidence des états cor- 
respondant à des "électrons" de masse +m mais de charge — e > donnant lieu à 
des énergies négatives. 

Ces problèmes pourraient n'avoir aucune importance en postulant simplement 
que ces états ne sont que mathématiques et que les vecteurs d'état acceptables 
sont ceux qui appartiennent au sous-espace engendré par les vecteurs propres de 
l'énergie correspondant à des valeurs propres positives. De cette manière, le vecteur 
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ip défini ci-dessus ne correspond simplement à aucun état physique. Malheureu- 
sement, en regardant ce qui se passe de plus près, on peut voir qu'un électron 
placé dans l'état d'énergie positif le plus faible a une probabilité non nulle de 
basculer vers un état d'énergie négative. Pour donner une interprétation physique 
à ce phénomène, Dirac imagine la théorie suivante : dans le vide, tous les états 
d'énergie négative sont saturés par un électron. Dans un système physique, il peut 
arriver que l'un de ces électrons s'échappe, formant ainsi un "trou". Ce trou se 
comporte alors exactement comme une particule de masse m et de charge — e que 
l'on appelle positron. Cette manière de présenter les choses est un progrès évident 
qui permet d'expliquer bon nombre de faits expérimentaux et qui permet de com- 
prendre la création/annihilation de paires de particules. Remarquons qu'il s'agit 
bien de paires de particules puisque quand un électron passe d'un état d'énergie 
négative à un état d'énergie positive, l'électron lui-même apparaît ainsi que le trou 
qu'il laisse, c'est-à-dire son anti-particule. Malheureusement, cette théorie possède 
aussi de gros inconvénients : lorsqu'un niveau d'énergie négative est occupé ou 
libéré, le nombre de particules que l'on observe n'est plus le même, ce qui est mal 
décrit par la mécanique quantique relativiste puisque par définition, elle attribue 
un espace de Hilbert à chaque particule. Il faut, pour rendre compte de nombreux 
phénomènes, bâtir une théorie qui permette la création/annihilation de particules 
dans sa formulation. C'est le but de la théorie quantique des champs. Pour finir, 
disons que la théorie quantique des champs elle-même est incomplète. Quand on 
la regarde dans le cadre de la relativité générale, elle dit que la notion de vide 
dépend des observateurs ce qui a conduit Hawking à émettre son hypothèse de 
rayonnement des trous noirs (inobservée à ce jour). Or ce fait, s'il est établi, est 
mal compris dans le cadre de la théorie. La théorie des cordes est beaucoup plus 
efficace sur ce point. 



ANNEXE A 



Rappels sur les transformées de Fourier 



Le but de ce paragraphe est de rappeler les définitions et propriétés de base qui 
concernent la transformation de Fourier et qui nous seront utiles lors de l'étude de 
la mécanique quantique. Soit / : 1R 3 — > C. On suppose que / tend suffisamment 
vite vers à l'infini. Nous ne serons pas plus précis dans ce texte. 

DÉFINITION 1.81. La fonction sur M 3 définie par 



où ■ représente le produit scalaire canonique de R 3 est appelée transformée de 
Fourier de f . 

Bien évidemment, nous avons choisi ici les constantes de normalisation adaptées 
à la situation qui nous intéresse. Alors, la transformation de Fourier a plusieurs 
propriétés qui nous seront utiles : 

Inversion de la transformée de Fourier : Si g est la transformée de Fourier 
de /, alors on a aussi : 



Théorème de Plancherel-Parseval : La transformation de Fourier est une 
isométrie de L 2 (IR 3 ). Autrement dit, si g est la transformée de Fourier de /, on a 





(1.82) 




(1.83) 
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Rappels sur les espaces de Hilbert 

La formulation de la mécanique quantique s'appuie sur les espaces de Hilbert. Nous 
faisons ici quelques rappels sur le sujet. 

1. Définitions, généralités 

1.1. Énoncés. 

DÉFINITION 11.84. (1) Soit E un espace vectoriel complexe. Une forme 
(-, •) : C x C — > C est appelée produit scalaire hermitien si 

- pour tous x, y, z G E, a G C, on a (x, y) = (y, x), (x, ay) = a(x, y), 
(x,y + z) = (x,y) + (x,z) ; 

- pour tout x G E, \\x\\ 2 := (x,x) est un réel positif ou nul, et nul si 
et seulement si x = 0. 

Un espace de Hilbert (hermitien) est un espace vectoriel complexe H muni 
d'un produit scalaire hermitien (•, •) pour lequel H est complet. 

Soit maintenant un espace de Hilbert H. On fixe y G H. La forme linéaire x — >• 
(y, x) est continue. Un théorème important est le résultat suivant qui affirme que 
la réciproque est vraie. 

THÉORÈME 11.85. f(de représentation de Riesz) 

Soit H un espace de Hilbert et f une forme linéaire continue sur H . Alors, il existe 
un unique y G H tel que pour tout x E H, f(x) = (y,x). Autrement dit, on a une 
isomorphisme canonique de H sur l'espace dual H' des formes linéaires continues 
de H. 

En raison de son importance pour la mécanique quantique, nous donnons une 
démonstration de ce théorème dans le paragraphe 11.21 Si chacun est familier avec 
la dimension finie, il n'est sans doute pas inutile de faire quelques rappels sur ce 
qui se passe en dimension infinie. En particulier, rappelons le résultat fondamental 
suivant 

THÉORÈME 11.86. SOit H un espace de Hilbert et F un sous-espace fermé. 
Alors, F®F ± = H. 

Nous ne donnons pas la preuve de ce résultat. Nous l'utiliserons plus loin. 

1.2. Démonstration du théorème III. 85l Soit / : H — >■ H une application 
linéaire continue. S'il existe y G H tel que / = (y,-) alors il est unique. En effet, 
si z G H vérifie la même relation, alors (y — z, •) est l'application linéaire nulle et 
donc \\y — z \\ 2 = (y — z, y — z) = ce qui implique y — z. Il reste donc à montrer 
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l'existence. Si / = 0, on prend y = 0. Sinon, Ker(f) est un espace vectoriel fermé 
(image réciproque d'un fermé par /) distinct de H. D'après le théorème III. 86\ 
Ker(f) 1 - n'est donc pas réduit à {0}. Soit b G Ker(f) ± . Posons p x = x — ^j^b. On 

a f(Px) = et donc b _L p x . Cela implique que (b,p x ) = i.e. f(x) = ^j^b,xj. 

On obtient le y cherché en posant y = {rnlb. 



2. Spectre des opérateurs 

2.1. Définitions. Nous avons vu l'importance en mécanique quantique de 
pouvoir écrire un vecteur comme combinaison linéaire de vecteur propres. Il faut 
rappeler d'abord quelques définitions. 

DÉFINITION 11.87. Soient H un espace de Hilbert, T : H — » H un opérateur 
(un application linéaire de H dans lui-même) et X G C. 

- A est une valeur propre de T s'il existe x G H, x ^ tel que T(x) = Xx 
autrement dit si T — Xld n'est pas injectif. L 'ensemble des valeurs propres est 
noté Vp(T). L'ensemble E\ := ker(T — Xld) est /'espace propre associé à X. 

- X est une valeur spectrale de T si T — Xld n'est pas inversible. L'ensemble des 
valeurs spectrales est appelé spectre de T et est noté o~{T). 

En dimension finie, il est bien évident que ces deux définitions sont équivalentes 
tandis qu'en dimension infinie, une valeur propre est aussi une valeur spectrale 
mais la réciproque est fausse en général. Il est important de noter que 

PROPOSITION 11.88. Les valeurs propres d'un opérateur auto-adjoint (i.e. un 
opérateur tel que pour tous x,y G H, (Tx, y) = (x, Ty) ) sont réelles. 

C'est une proposition très importante : en mécanique quantique, les mesures d'une 
quantité physique sont des valeurs propres d'opérateurs auto-adjoints. Cette pro- 
position assure que ces grandeurs sont réelles. La preuve est évidente : si a est une 
valeur propre et x un vecteur propre associé, on a, puisque T est auto-adjoint, 

a||x|| 2 = (x,Tx) = (Tx,x) = 57||x|| 2 , 

ce qui implique a = 57 et donc a 6 1. En travaillant un peu plus, on peut voir que 
la proposition est vraie aussi avec les valeurs spectrales mais ce sont les valeurs 
propres qui seront importantes pour la mécanique quantique. 



2.2. Décomposition spectrale d'un opérateur compact. L'un des princi 
pes importants de la mécanique quantique est de représenter les quantités phy- 
siques par des opérateurs d'un espace de Hilbert dont les vecteurs propres forment 
une base hilbertienne de H. Tous les opérateurs ne possèdent pas cette propriété. 
Un contre-exemple est donné dans le paragraphe 12.2. 1[ Par contre, on a : 

THÉORÈME 11.89. Soit H un espace de Hilbert hermitien et T un opérateur auto- 
adjoint compact (i.e. l'image de toute partie bornée est relativement compacte). 
Alors H = ® a eVp(T)E a . De plus cette somme est orthogonale. 
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Rappelons que par définition la somme directe infinie (BiEi des espaces vectoriels 
Ei est l'ensemble des combinaisons linéaires finies de vecteurs de Ei. Nous donnons 
une démonstration de ce théorème dans le paragraphe 12.2.21 Ce théorème implique 

COROLLAIRE 11.90. Soit H un espace de Hilbert hermitien et T un opérateur 
auto-adjoint compact, alors Vp(T) est au plus dénombrable et tout vecteur ip de H 
s 'écrit 

où P a est le projecteur orthogonal sur l'espace E a . 

Nous démontrons ce corollaire dans le paragraphe 12 . 2 . 31 Pour finir, en prenant une 
base hilbertienne dans chaque espace propre nous obtenons aussi 

COROLLAIRE 11.91. Soit H un espace de Hilbert hermitien et T un opérateur 
auto-adjoint compact. Alors, il existe une base hilbertienne orthonormée de H (pas 
forcément dénombrable) composée uniquement de vecteurs propres de T. 

Remarque 11.92. Remarquons que pour a ^ 0, l'espace propre E a est de di- 
mension finie. En effet, sinon, considérons une suite orthonormée (e n ) de E a qui 
forme donc un sous-ensemble borné de E a . Puisque l'opérateur T est compact, 
T(e n ) admet une sous-suite convergente. Mais, cela ne peut pas être vrai car pour 

||T(e n ) - T(e m )f = a 2 \\e n - e m f = 2a 2 
la dernière égalité résultant de Pythagore. 

2.2.1. Contre- exemple. Nous allons construire un espace de Hilbert H, un opé- 
rateur T continu de H, auto-adjoint qui n'admet aucun vecteur propre. Nous 
définissons H = Z 2 (Z, C) comme l'espace des suites indexées par Z, à valeurs 
complexes, de carré sommable, munies du produit hermitien canonique. Notons 
A l'opérateur défini par A((xi)i) = Son adjoint est clairement donné par 
A*((xi)i) = (ar<_i)i. Notons donc T = A + A*. On a donc T((x i ) < ) = l/2(x;_i + 
Xi + i). Par construction, T est auto-adjoint, borné (de norme 1) donc continu. Par 
ailleurs, soit x un vecteur propre associé à une valeur propre À. On a donc une suite 
récurrente définie par — 2Xxi + = 0. Notons ai, a2 les racines complexes 
de l'équation y 2 — 2Xy + 1 = 0. Il est alors classique que : 

- si ai 7^ Œ2, la suite x est de la forme Xi = C\a\ + C^a^ et n'est donc pas dans 
H sauf si elle est nulle (car elle n'est pas de carré sommable). 

- si ai = a 2 = a, la suite x est de la forme x^ = (C\i + C 2 )a* qui n'est pas non 
plus de carré sommable. 

2.2.2. Démonstration du théorème \II.8£\ Nous commençons par démontrer le 
lemme suivant : 

LEMME 11.93. La norme \\T\\ (norme d'opérateur) est valeur propre de T. 
Preuve du lemme III. 931 

Notons a = ||T||. Si a = 0, le résultat est évident. Supposons a^0. Par définition, 



68 



B. RAPPELS SUR LES ESPACES DE HILBERT 



il existe une suite (x n ) de vecteurs unitaires telle que lim n ||T(x„)|| = a. Notons 
A = ald — T. On a par définition de (x n ) 

\im(A(x n ),x n ) = 0. (11.94) 

n 

L'opérateur A est auto-adjoint et positif. En particulier, la forme (u, v) — > B(u, v) := 
(Au, v) est bilinéaire symétrique. Par Cauchy-Schwarz : 

\\A{x n ) || 2 = B{x n , A(x n )) < B(x n , x n )B{A{x n ), A{x n )). (11.95) 

D'après flll.94p . lim n B(x n , x n ) = 0. De plus, 

B(A(x n ),A(x n )) = (A 2 (x n ),A(x n )) < \\A\\\\A(x n )\\ < \\A\\ 2 . 

On déduit de (III. 951) que lim n A(x n ) = et donc que lim n (T(x n ) — ax n ) = 0. 
Par ailleurs, T étant compact, T(x n ) converge (quitte à prendre une sous-suite). 
Ainsi (ax n ) n est convergente. Puisque a / 0, (x n ) converge vers un x non nul 
puisqu'unitaire. Par continuité de T, on a 

T(x) — ax = lim(T(x„) — ax n ) = 0. 

n 

Cela démontre le lemme. □ 
On peut maintenant passer à la 

Preuve du théorème III. 89l Notons F = ® a eVp{T)E a - Supposons F ^ H. D'après 
le théorème III.86I l'espace vectoriel F 1 - n'est pas réduit à {0}. De plus, il est stable 
par T. On déduit du lemme III. 931 qu'il existe a valeur propre de T/ F ± . Soit x un 
vecteur propre non nul associé. Puisque a est aussi valeur propre de T, a; G F H F- 1 . 
On en déduit une contradiction puisque d'après le théorème III. 861 FnF 1 - = {0}.D 

2.2.3. Démonstration du corollaire \II.9Œ Remarquons d'abord que P a est bien 
définie. En effet, E a = (T— «/c/) _1 ({0}) est fermé en tant qu'image réciproque d'un 
fermé par une application continue. D'après le théorème 111.86} on a H = E a © 
ce qui donne naturellement P a . Ensuite, le théorème dit que tout vecteur ip est 
limite de ip n où chaque ip n = X^=i V'oj °ù l es e E a n sont des vecteurs propres 
de T deux à deux orthogonaux. Notons fl n = {a™, • • • , a£} les valeurs propres 
impliquées dans i[) n et posons Q' n = U£ =0 fi n les valeurs propres impliquées dans 
tous les ipi pour i < n. Posons maintenant u n = Y^aeQ' Pa(ip)- H est facile de 
voir que — u n \\ < \\ip — ip n \\ si bien que {u n ) converge vers ij). Par ailleurs, par 
définition, 

Mm u n = V ]P a {i>) 

où fl' = U n( z^fl' n est un ensemble au plus dénombrable. On en déduit le corollaire. 

2.3. Décomposition spectrale dans le cadre de la mécanique quan- 
tique. Nous avons donné dans le paragraphe précédent le théorème de décomposi- 
tion spectrale des opérateurs compacts. Malheureusement, ces opérateurs sont 
rares et notamment, ceux dont nous aurons besoin ne le sont pas en général. 
Rappelons le principe Ile) de mécanique quantique énoncé dans le chapitre IIHI 
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Principe de décomposition spectrale : Notons (a a ) a les valeurs propres de l'ob- 
servable A. Soit ip le vecteur d'état du système. La probabilité de trouver a a en 
mesurant la grandeur physique a a à l'instant t est égale à HV'aJI 2 où ip a est la 
projection orthogonale de ip(t) sur le sous-espace propre de A associé à la valeur 
propre a a . 

Ce principe sous-entend que l'opérateur A a une propriété de décomposition spec- 
trale telle que celle donnée pour les opérateurs compacts. Or, on a vu dans le para- 
graphe 12.2.11 que, même pour un opérateur borné, ce résultat est faux en général. 
Que dire alors des opérateurs simples comme ceux rencontrés en mécanique ondu- 
latoire (position et quantité de mouvement) qui ne sont même pas bornés? Pour 
faire les choses rigoureusement, il convient de se placer dans un espace plus grand 
que eu- Nous ne donnerons pas cette construction ici mais nous expliquons com- 
ment cela se passe lorsque A est l'observable position ou quantité de mouvement 
de la mécanique ondulatoire. En particulier, on travaille dans l'espace de Hilbert 
L 2 . Commençons par rappeler que si x est le vecteur position de la particule, l'ob- 
servable associée est la multiplication par x. Pour x fixé, l'espace propre est de 
dimension 1 et le projecteur associé est la distribution de Dirac ô x au point x. 
Cette fonction est nulle dans L 2 et donc L 2 n'est pas le bon espace de fonctions. 
Néanmoins chaque fonction de L 2 peut s'écrire comme une somme infinie (en l'oc- 
currence une intégrale) de projections sur les espaces propres. Plus précisément, 
Vp(x) = R 3 et on a ip(y) = J xm3 ô y (x)tp(x)dx. 

De même si on regarde la première composante du vecteur quantité de mouvement 
p x , l'opérateur associé est p x = —ihd x dont les vecteurs propres sont les fonctions 
p — > eTi px associées à la valeur propre x G M. On peut décomposer ip dans cette 
"base" de vecteurs propres en utilisant l'inversion de la transformée de Fourier. 
La projection de ip sur l'espace propre associé à x est p — » e l ^ px ip(p) où cp est la 
transformée de Fourier de tp. En intégrant sur l'ensemble des valeurs propres (R), 
on retrouve bien ip. 

Cette manière de procéder se généralise de manière rigoureuse à tout opérateur 
auto-adjoint même non borné. Nous n'expliquerons pas ici la manière de s'y prendre. 

3. Diagonalisation simultanée de deux opérateurs qui commutent 

Considérons deux opérateurs A et B auto-adjoints d'un espace de Hilbert H 
satisfaisant le principe de décomposition spectrale discutée dans le paragraphe 
précédent. Alors 

PROPOSITION 11.96. Si AB = BA, il existe une base hilbertienne composée de 
vecteurs qui sont propres à la fois pour A et B. 

En effet, soit x un vecteur propre de A associé à une valeur propre À alors ABx = 
BAx = XBx et donc Bx est aussi vecteur propre de A associé à A. En particulier, 
les espaces propres de A sont stables par B. Il ne reste plus qu'à appliquer le 
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principe de décomposition spectrale à l'opérateur B restreint à chacun des sous- 
espaces propres de A. 

4. Produit tensoriel d'espaces de Hilbert 

Soient G, H deux espaces de Hilbert (cela pourrait être seulement des espaces 
vectoriels). On peut montrer (ce que nous ne ferons pas ici) qu'à isomorphisme 
près, il existe un unique espace de Hilbert noté G <g> H appelé produit tensoriel de 
G par H et une application linéaire T : G x H ^ G ® H tels que 

- T(G x H) engendre G (g) H ; 

- Si (<7i)i, (hj)j sont des bases hilbertiennes de G et H alors (T(gi,hj))ij est une 
base hilbertienne de G <S> H. 

On notera généralement u <S> v à la place de T(u, v ). Si G et H sont de dimension 
finie, c'est aussi le cas de G ® H et on a 

dim(G ® H) = dim(G)dim(H). 

Le produit hermitien sur G <g> if est tel que pour m, m' G G, t> , t> ' G if, 

(■u ®v,u' ® v') = (u, u')g(v, v')h- 

Pour finir, si /, /' sont des opérateurs de G et H, on obtient un opérateur f ® f 
de G ® H en posant 

f®f{u®v) = f{u)®f{v). 
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Les spineurs 

La construction précise des spineurs en général est compliquée. Une très bonne 
référence est par exemple [Hiz99|. Nous nous plaçons ici dans le cadre simple de 
la relativité restreinte, c'est-à-dire sur R 4 munie de la forme quadratique rj := 
dx 2 — dt 2 . L' algèbre de Clifford Cl(R 4 ,rj) est définie par 

Cl(R 4 ,7]) :=T(R 4 )/I(R 4 ,r]) 

où T(M 4 ) est l'algèbre tensorielle de R 4 , autrement dit 

et où /(M 4 , rj) est l'idéal engendré par les éléments de la forme x <8> x + r](x,x)l. 
La loi de multiplication interne sur C7(1R 4 ) (c'est-à-dire celle induite par ® sur le 
quotient) est notée " • " et s'appelle multiplication de Clifford. On peut alors vérifier 
que Cl(R 4 ,rj) est l'algèbre engendrée par M 4 avec la relation 

v ■ w + w ■ v — —2r](v, w)l (III. 97) 

pour tous v, w G M 4 . En particulier, notons (ei, e±) la base canonique de M 4 , 
on a les relations 

" Gj ~\~ G-j ' 

si i 7^ j et 

a -1 si i e {1,2,3} 
{ 1 si i = 4. 

On peut vérifier que 

{e h ■ e i2 ■ ... ■ e ik \l < h < ■ ■ ■ < i k ,0 < k < 4} 
est une base de l'espace vectoriel Cl(M. 4 ,ri). 

En fait, ce sera la complexification de l'algèbre de Clifford 

Cl(R 4 ,ri) =Cl(R 4 ,ri) ® K C 

qui nous intéressera. On peut maintenant regarder les éléments de C/(M 4 , rj) comme 
des endormophismes de l'espace vectoriel 0(M 4 ,?7). En effet, x G 0(M 4 ,?7) s'iden- 
tifie h y — >■ x-y. On peut montrer que sous cette action, il existe un espace vectoriel 
noté E 4 qui est stable et de dimension minimale 4. Si l'on avait travaillé dans R n , 
la dimension aurait été de 2^- n ^ 2 \ Sans rentrer dans les détails et notamment en 
oubliant les dimcultées liées à la parité de la dimension, cette dimension de 2^ n ^ 2 ^ 
n'est pas surprenante : l'espace des applications linéaires d'un espace vectoriel de 
dimension m = 2 n l 2 est 2 m = 2 n qui est exactement en dimension paire du moins, 
la dimension complexe de Cl(R A ,rj). L'expression explicite de £4 est compliquée 
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et mutile. Il suffit de retenir, en réécrivant les choses de manière plus habituelle, 
qu'il existe une représentation irréductible 

p : Cl(M.\r]) ->■ End c (S 4 ) 

appelée représentation spinorielle complexe. Pour v G M 4 C CZ(M 4 ,?7) et ip G £4, 
on notera v ■ ip plutôt que p{v)ip. Soit maintenant ip : R 4 — > S4. En prenant une 
base de £4, ip est donc une fonction à 4 composantes complexes : elle correspond 
au vecteur d'état qui apparaît dans l'équation de Dirac dans le chapitre sur la 
mécanique quantique relativiste. On définit maintenant l'opérateur 

4 

D := ^ Ci ■ di. 

i=i 

L'opérateur D est appelé opérateur de Dirac. Les relations (1III.97P montrent immédiatement 
que 

D 2 = — □ = —A x + d tt . (111.98) 

On peut aussi construire sur S 4 de manière naturelle un produit hermitien qui est 
tel que D est auto-adjoint. 
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